BitSet的使用场景及简单示例_biteset使用场景_jxl-taylor的博客-程序员秘密

技术标签: 计算机原理  lang  

BitSet简介

    类实现了一个按需增长的位向量。位 set 的每个组件都有一个boolean值。用非负的整数将BitSet的位编入索引。可以对每个编入索引的位进行测试、设置或者清除。通过逻辑与、逻辑或和逻辑异或操作,可以使用一个BitSet修改另一个BitSet的内容。

    默认情况下,set 中所有位的初始值都是false。

    每个位 set 都有一个当前大小,也就是该位 set 当前所用空间的位数。注意,这个大小与位 set 的实现有关,所以它可能随实现的不同而更改。位 set 的长度与位 set 的逻辑长度有关,并且是与实现无关而定义的。

    除非另行说明,否则将 null 参数传递给BitSet中的任何方法都将导致NullPointerException。

    在没有外部同步的情况下,多个线程操作一个BitSet是不安全的

基本原理

    BitSet是位操作的对象,值只有0或1即false和true,内部维护了一个long数组,初始只有一个long,所以BitSet最小的size是64,当随着存储的元素越来越多,BitSet内部会动态扩充,最终内部是由N个long来存储,这些针对操作都是透明的。

    用1位来表示一个数据是否出现过,0为没有出现过,1表示出现过。使用用的时候既可根据某一个是否为0表示,此数是否出现过。

    一个1G的空间,有 8*1024*1024*1024=8.58*10^9bit,也就是可以表示85亿个不同的数

使用场景

    常见的应用是那些需要对海量数据进行一些统计工作的时候,比如日志分析、用户数统计等等

    如统计40亿个数据中没有出现的数据,将40亿个不同数据进行排序等。
    现在有1千万个随机数,随机数的范围在1到1亿之间。现在要求写出一种算法,将1到1亿之间没有在随机数中的数求出来

代码示例

package util;

import java.util.Arrays;
import java.util.BitSet;

public class BitSetDemo {

	/**
	 * 求一个字符串包含的char
	 * 
	 */
	public static void containChars(String str) {
		BitSet used = new BitSet();
		for (int i = 0; i < str.length(); i++)
			used.set(str.charAt(i)); // set bit for char

		StringBuilder sb = new StringBuilder();
		sb.append("[");
		int size = used.size();
		System.out.println(size);
		for (int i = 0; i < size; i++) {
			if (used.get(i)) {
				sb.append((char) i);
			}
		}
		sb.append("]");
		System.out.println(sb.toString());
	}

	/**
	 * 求素数 有无限个。一个大于1的自然数,如果除了1和它本身外,不能被其他自然数整除(除0以外)的数称之为素数(质数) 否则称为合数
	 */
	public static void computePrime() {
		BitSet sieve = new BitSet(1024);
		int size = sieve.size();
		for (int i = 2; i < size; i++)
			sieve.set(i);
		int finalBit = (int) Math.sqrt(sieve.size());

		for (int i = 2; i < finalBit; i++)
			if (sieve.get(i))
				for (int j = 2 * i; j < size; j += i)
					sieve.clear(j);

		int counter = 0;
		for (int i = 1; i < size; i++) {
			if (sieve.get(i)) {
				System.out.printf("%5d", i);
				if (++counter % 15 == 0)
					System.out.println();
			}
		}
		System.out.println();
	}
	
	/**
	 * 进行数字排序
	 */
	public static void sortArray() {
		int[] array = new int[] { 423, 700, 9999, 2323, 356, 6400, 1,2,3,2,2,2,2 };
		BitSet bitSet = new BitSet(2 << 13);
		// 虽然可以自动扩容,但尽量在构造时指定估算大小,默认为64
		System.out.println("BitSet size: " + bitSet.size());

		for (int i = 0; i < array.length; i++) {
			bitSet.set(array[i]);
		}
		//剔除重复数字后的元素个数
		int bitLen=bitSet.cardinality();	

		//进行排序,即把bit为true的元素复制到另一个数组
		int[] orderedArray = new int[bitLen];
		int k = 0;
		for (int i = bitSet.nextSetBit(0); i >= 0; i = bitSet.nextSetBit(i + 1)) {
			orderedArray[k++] = i;
		}

		System.out.println("After ordering: ");
		for (int i = 0; i < bitLen; i++) {
			System.out.print(orderedArray[i] + "\t");
		}
		
		System.out.println("iterate over the true bits in a BitSet");
		//或直接迭代BitSet中bit为true的元素iterate over the true bits in a BitSet
		for (int i = bitSet.nextSetBit(0); i >= 0; i = bitSet.nextSetBit(i + 1)) {
			System.out.print(i+"\t");
		}
		System.out.println("---------------------------");
	}
	
	/**
	 * 将BitSet对象转化为ByteArray
	 * @param bitSet
	 * @return
	 */
	public static byte[] bitSet2ByteArray(BitSet bitSet) {
        byte[] bytes = new byte[bitSet.size() / 8];
        for (int i = 0; i < bitSet.size(); i++) {
            int index = i / 8;
            int offset = 7 - i % 8;
            bytes[index] |= (bitSet.get(i) ? 1 : 0) << offset;
        }
        return bytes;
    }
 
	/**
	 * 将ByteArray对象转化为BitSet
	 * @param bytes
	 * @return
	 */
    public static BitSet byteArray2BitSet(byte[] bytes) {
        BitSet bitSet = new BitSet(bytes.length * 8);
        int index = 0;
        for (int i = 0; i < bytes.length; i++) {
            for (int j = 7; j >= 0; j--) {
                bitSet.set(index++, (bytes[i] & (1 << j)) >> j == 1 ? true
                        : false);
            }
        }
        return bitSet;
    }
	
	/**
	 * 简单使用示例
	 */
	public static void simpleExample() {
		String names[] = { "Java", "Source", "and", "Support" };
		BitSet bits = new BitSet();
		for (int i = 0, n = names.length; i < n; i++) {
			if ((names[i].length() % 2) == 0) {
				bits.set(i);
			}
		}

		System.out.println(bits);
		System.out.println("Size : " + bits.size());
		System.out.println("Length: " + bits.length());
		for (int i = 0, n = names.length; i < n; i++) {
			if (!bits.get(i)) {
				System.out.println(names[i] + " is odd");
			}
		}
		BitSet bites = new BitSet();
		bites.set(0);
		bites.set(1);
		bites.set(2);
		bites.set(3);
		bites.andNot(bits);
		System.out.println(bites);
	}

	public static void main(String args[]) {
		//BitSet使用示例
		BitSetDemo.containChars("How do you do? 你好呀");
		BitSetDemo.computePrime();
		BitSetDemo.sortArray();
		BitSetDemo.simpleExample();
		
		
		//BitSet与Byte数组互转示例
		BitSet bitSet = new BitSet();
        bitSet.set(3, true);
        bitSet.set(98, true);
        System.out.println(bitSet.size()+","+bitSet.cardinality());
        //将BitSet对象转成byte数组
        byte[] bytes = BitSetDemo.bitSet2ByteArray(bitSet);
        System.out.println(Arrays.toString(bytes));
         
        //在将byte数组转回来
        bitSet = BitSetDemo.byteArray2BitSet(bytes);
        System.out.println(bitSet.size()+","+bitSet.cardinality());
        System.out.println(bitSet.get(3));
        System.out.println(bitSet.get(98));
        for (int i = bitSet.nextSetBit(0); i >= 0; i = bitSet.nextSetBit(i + 1)) {
			System.out.print(i+"\t");
		}
	}
}

 

参考:

http://blog.csdn.net/haojun186/article/details/8482343

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/jfengamarsoft/article/details/86076754

智能推荐

StringUtils的各项用法_躁动的胖子的博客-程序员秘密

StringUtils 源码,使用的是commons-lang3-3.1包。下载地址 http://commons.apache.org/lang/download_lang.cgi

python matplotlib 画图整理_matplotlib 每次调用函数画一张图_angnuan123的博客-程序员秘密

这里大部分参考了博主:https://blog.csdn.net/Notzuonotdied/article/details/77876080  的整理x结果## plot 板块##import matplotlib.pyplot as pltimport numpy as npx=np.linspace(1,10,10)y=xy1=2*x**2+1y2=2*x**3+1...

一、buildroot-2014.08编译根文件系统(nfs挂载)_Lidroid的博客-程序员秘密

buildroot(Making Embedded Linux Easy)编译环境它其实就是一个脚本和补丁的集合,简单来讲就是辅助编译嵌入式系统中的boot、kernel、rootfs、cross compiler等。本篇主要讲如何使用buildroot编译根文件系统并且使用开发板用nfs方式挂载:宿主机环境:虚拟机+ubuntu14.04 x86目标机环境:tiny44121

FFN_FaceFutureNews_2019_8_1_007苏的博客-程序员秘密

技术社区新闻:08-01: 阿里云社区新闻:NEWS_1:工程师的灵魂拷问:你的密钥安全吗?链接:https://yq.aliyun.com/articles/712063NEWS_2:Apache Flink 1.9.0 为什么将支持 Python API ?链接:https://yq.aliyun.com/articles/712058NEWS_3:阿里云OSS如何使用和...

随便推点

emacs lisp总结_weixin_33910460的博客-程序员秘密

Emacs有三种Lisp模式,其命令名称如下:emacs-lisp-mode 用于Emacs Lisp代码的编辑(文件名.emacs或后缀.el)lisp-mode 用来编辑另一个Lisp系统的Lisp代码(后缀.l或.lisp)lisp-interaction-mode 用来编辑和运行Emacs Lisp代码(交互模式)本文只讨论 lisp-interaction-...

python中内置数学函数详解和实例应用之三角函数曲线_初级阶段(三)_python 反正弦函数_SoftwarePM的博客-程序员秘密

学习目标:利用matplotlib 和 numpy 画三角函数曲线学习内容:正弦,余弦,正切,余切函数曲线双曲正弦,双曲余弦,双曲正切,双曲余切函数曲线反正弦,反余弦,反正切,反余切函数曲线反双曲正弦,反双曲余弦,反双曲正切,反双曲余切函数曲线学习产出:1.1, python画正弦函数曲线,保持原有的position不变的情况,代码如下:import numpy as npfrom matplotlib import pyplot as plt plt.figure(figsiz

教你学会Sql中 ROW_NUMBER的用法_weixin_30270561的博客-程序员秘密

ROW_NUMBER SqlServer 2005 推出的新功能。语法:select *,ROW_Number() over(order by 字段) as '新列名' from table顾名思义:ROW_NUMBER() 为根绝条件查询出来的数据添加一列(有序的一列,连续序号的1,2,3....),虽然说数据库中的表的自增列的ID也是连续的,但是根据筛选条件或者删除行导致ID序号...

[译]英雄联盟聊天服务的持久层演进_ifeves的博客-程序员秘密

原文:CHAT SERVICE ARCHITECTURE: PERSISTENCE玩了很多年英雄联盟,我和全球的一些玩家已经建立了良好的社交关系。不管他们是工作中的朋友,...

Nginx捕获并自定义proxy_pass返回的错误-程序员秘密

需求 实际情况:后端图片存储服务对接华为存储,把数据写在华为上。上级会不定时的对图片进行抽查考核,要求5s内必须返回数据,但是图片服务不定时会挂掉,由于代码年代久远已无人维护,只好在图片服务前端再部署个nginx,通过proxy_pass代理后端服务,当后端返回404或5xx错误时,对proxy_pass进行捕获,实现自定义输出。解决方法upstream DGIMediaServer { server 172.24.49.xxx:6551 fail_timeout=3s;}server {

VC 开发ocx_c++ ocx_FrankieWang008的博客-程序员秘密

[转]基于MFC的ActiveX控件开发作者:lidan | 出处:博客园 | 2012/3/13 16:10:34 | 阅读22次ActiveX 控件是基于组件对象模型 (COM) 的可重用软件组件,广泛应用于桌面及Web应用中。在VC下ActiveX控件的开发可以分为三种,一种是直接用COM的API来开发,这样做显然非常的麻烦,对程序员要求也非常高,因此一般是不予考虑的;一

推荐文章

热门文章

相关标签