当前位置: 首页 > news >正文

桶排序相关知识深入理解(计数排序,基数排序)

一、计数排序

问题引入

这里有一堆1-100的数,请对这些数字进行排序?

问题解决

ok这里的这些数字首先呢,是什么?范围是有限的,也就是说这些数最小是1 最大是100

我们可不可以用一个数组存储这些数?如果这个数是1,那就在数组的1位置上+1,以此类推

之后把数组从1-100依次排数,排到原数组里面即可

问题本质

问题的本质是什么?

对有范围的数进行排序,没错,有范围的数,然后呢在这个范围里,数字按照自己的大小进行入队,之后依次出队,这真的只是计数排序吗?

实则桶排序,详细看文章的第三点

代码

//桶排序
public class Count {//计数排序 0~200public static void countSort(int[] arr){if (arr==null||arr.length<2)return;//寻找数组最大值,然后设桶int max=Integer.MIN_VALUE;for (int i = 0; i < arr.length; i++) {max=Math.max(max,arr[i]);}int []bucker=new int[max+1];for (int i = 0; i < arr.length; i++) {bucker[arr[i]]++;}int i=0;for (int j = 0; j < arr.length; j++) {while (bucker[j]>0){arr[i++]=j;bucker[j]--;}}}
}

二、基数排序

我们有一堆数字,这些数字最大呢是五位数,怎么排序?

我们可以从个位开始,到千位,依次排序,谁的权重高?万位权重最高,万位最后排

简单的入桶
 

//基数排序public static void radixSortQuick(int[] arr,int L,int R){int max= (int) Long.MIN_VALUE;for (int i = L; i <= R; i++) {if (arr[i]>max)max=arr[i];}//最大数是几位数int maxdigit=0;while (max>0){maxdigit++;max/=10;}Queue<Integer>[] arrayList=new Queue[10];for (int i = 0; i < 10; i++) {//每一个位置都是null,我们如果不去初始化// 那么在后面加数的时候会报错你让null.add//null.pull什么的不就会错吗arrayList[i]=new LinkedList<>();}//总循环,每次判断每一个位置上的排序for (int i = 1; i < maxdigit + 1; i++) {for (int j = L; j < R+1; j++) {arrayList[getdigitnum(arr[j],i)].add(arr[j]);}int index=L;//从arr的L开始 替换桶 桶怎么排数字?//一个一个排就ok了,空了就break//如下for (int j = 0; j < 10; j++) {while (!arrayList[j].isEmpty()){arr[index++]=arrayList[j].poll();}}}}

三、桶排序(计数与基数的底层及优化)
 

计数排序的本质

计数排序本质到底是什么?有人就好奇了,这个跟桶有什么关系?如果是基数排序,那确实跟桶有关,但是计数排序怎么有?

计数排序如果单单的是计数,那当然,与桶的关系不明显,但是如果是一个实体类,里面存储age或者有范围的数字的话,那可以计数吗?当然不可以了,那就是桶了,每一个位置上都是linklist,然后入链表

计数排序跟基数排序的关系

有人问了,计数排序跟基数排序有什么区别?都是排序数字,同时为啥会有这两种?

仔细来看基数排序是计数排序的进阶,为什么这么说?

首先计数排序是什么?对一个范围上的数进行排序

基数排序是什么?对多个位置上的数进行多次排序

ok,根据这两句话就可以判断出来,基数排序是多次的计数排序,计数排序里面的1-100这个范围,其实呢跟位数里面每一位都是0-9有什么区别吗?

除了范围加大了,本质上没什么区别。也就是说计数排序,其实就是范围大的基数排序里面多轮排序的一种情况

实际业务中,用户的年龄,类型等各种数据就是各种不同的范围,如果说这个范围可控,这个范围只有几个选项那就可以进行桶排序

所以,计数排序是单一范围但是范围较大的的基数排序

基数排序的优化

基数排序在干嘛?在入桶然后每个桶都出来,我们看图

如上图所示,我们把所有数都入桶,是通过个位数判断入桶,之后呢,再一个一个的出桶,放到相应的位置上,因为我们是从左往右出桶,所以相关数可以放到正确的位置上。

如果已经经过了几轮的排序,先进的数字因为在前几轮的排序排好了后要排在后面数字的前面,所以先进的数字要先出。位置也正好对上。

但是这样的排序由于用的是分开的队列,内存不是连续的,内存的利用率,以及查询速度等,都比普通的连续地址的数组要慢很多,那么可以优化吗?答案是可以。

我们需要什么?需要的是确定当前数要放的位置,同时前面进的数要放前面,后面进的数要放后面。

位置怎么确定?我们想想,第一个位置上的数字是不是可以确定有几个?个位是0的可以确定个数,个位是1的也可以确定个数,如果个位是0 1 的个数相加是什么?是最右边的个位是1的数应该放的位置+1。比如上面图里面的31 出来应该放在数组的第四位,index是3,而 个位是0 1的总数是4

这是规律吗?是的

我们可以将其优化成数组排序,具体是这样的

首先进入该轮个位排序,数组统计每一种可能的数,然后再把数字的0加到1上,1位置上的数加到2上,此时数组存储的是该种数最后一个数该放的位置+1

之后从右往左遍历,判断什么位上的数,然后放置到help数组上这个数,然后help数组拷贝到原数组即可,多轮均这样即可。

代码如下

//基数排序隐式桶public static void radixSort(int [] arr,int L,int R){//首先我们算数组的最大位数是多少位//其次每次算这个数在这个位上的数字int max=(int) Long.MIN_VALUE;for (int i = L; i <= R; i++) {if (arr[i]>max)max=arr[i];}int maxdigit=0;while (max>0){max/=10;maxdigit++;}int[] help=new int[R-L+1];//每一位进行一次排序,占比最大的最后排序,比如会员和年龄 会员肯定优先,那么会员是后排//会员在maxdigit这里 年龄在1这里 作为第一个进行排序的for (int i = 1; i < maxdigit+1; i++) {int count[]=new int[10];for (int j = L; j < R+1; j++) {//在某位上的count++count[getdigitnum(arr[j],i)]++;}for (int j = 1; j < count.length; j++) {count[j]=count[j-1]+count[j];}for (int j = help.length-1; j >=0 ; j--) {//从count右到左,算自己位数是几位,然后放在help里面的第x-1处//j+R是排序的树所在的位置,i是现在是排的那个位置上的 十位个位百位//在help数组上放arr 位置是count数组计算这个数的所在位数上的值//在count里面存了要放的位置//测试//                int a=getdigitnum(arr[j+L],i);
//                int b=count[getdigitnum(arr[j+L],i)];
//                int c=j+L;help[count[getdigitnum(arr[j+L],i)]-1]=arr[j+L];count[getdigitnum(arr[j+L],i)]--;}for (int j = 0; j < help.length; j++) {arr[j+L]=help[j];}}}//得到数字在d位上的值public static int getdigitnum(int num,int d){//pow是10的d-1次方return ((num/((int)Math.pow(10,d-1)))%10);}
优化性能对比

测试代码如下,结果为百万数据优化了86%左右 一万数据优化了44% 将近一半

 public static void main(String[] args) {long all1=0;long all2=0;for (int i = 0; i < 100; i++) {int[] arr1 = DuiShuQi.generate(10000, 1000);//时长测试 隐式桶 显式桶//一万是    37   60      30    57//十万是    255  825     282   848//一百万是  2296 15352   2288  14526//一千万是  23000 208100 36915 262895//也就是说一万是差两倍     一万耗时从   0.059   优化到了0.033s 优化了44%//十万是三倍多           十万耗时从    0.84s  优化到了0.27s  优化了67.9%//一百万是七倍           一百万耗时从  14.9s  优化到了2.3s   优化了86.6%//一千万是八倍左右的差距  一千万的耗时从 235.5s 优化到了29.9s  优化了87.3%//因为显式桶内存不是连续的//内存间的跳跃耗时与数组中连续的空间时间不同//同时由于显式桶内存是不连续的,对空间的利用率非常的不友好//就像jvm里面已经拒绝了标记清除一样,我们这里需要拒绝这种断断续续的排序方式int[] arr2 = arr1.clone();//测试排序隐式桶的时间long cur=  System.currentTimeMillis();//System.out.println("cur:"+cur);radixSort(arr1,0,arr1.length-1);all1+=System.currentTimeMillis()-cur;//System.out.println("all1:"+all1);//测试排序显示桶的时间cur=  System.currentTimeMillis();radixSortQuick(arr2,0,arr2.length-1);//System.out.println(cur);all2+=System.currentTimeMillis()-cur;//System.out.println(all2);DuiShuQi.compare(arr1,arr2);}System.out.println("all1 "+all1);System.out.println("all2 "+all2);}

四、资料链接

github链接,本文的代码为src下code05里面的count和radix类,用到的对数器是DuiShuQi文件夹下的类

项目的百度网盘链接 所处位置与github中的相同

http://www.dtcms.com/a/586547.html

相关文章:

  • 医院门户网站建设规划时尚flash网站
  • 怎么做网站免费的刷赞漳州台商投资区建设局网站
  • 100m网站注册织梦 网站公告
  • 网站备案年限查询电子邮箱注册网站申请
  • 张家港网站推广优化wordpress能做交互类网站
  • 北京建站的中国建设部网站能查叉车证
  • php外贸网站制作淄博网站制作公司推广
  • 懂事务与数据库连接池
  • 几种限流算法介绍和使用场景
  • cesium126,230417,模型太亮白:
  • wordpress网站如何视觉设计网站有哪些
  • 灵璧做网站的公司百搜科技
  • 黑龙江省建设安全监督网站优化wordpress访问速度
  • 佛山网站建设怎么办黑龙江建设安全监督网查询
  • 网站后台这么做视频教程做网站风险分析
  • Photoshop合成的核心知识
  • 开发网站需要什么条件做网站首页文件
  • linux之Access,Modify,Change
  • Unicode全字符集加解密工具 - 命令行交互版:功能完整的终端解决方案
  • 昆明网站制作公司百度推广网站建设高端培训学校
  • 福田网站设计哪家好青海网站建设多少钱
  • 怎么在网站上做推广广州网站建设专家
  • 宽带和方向性无线信道
  • 建立一个属于自己的网站公司是做小程序还是做网站
  • 做欧洲电商看哪个网站网站开发的英文书有什么软件
  • IEC101协议解析工具
  • 仓颉(Cangjie)语言之网络编程浅析
  • 沈阳奇搜建站云建站平台哪家好
  • Linux应用开发-17-套接字
  • AI营销获客效果评估:从效率到回报的核心指标框架