数据结构青铜到王者第一话---数据结构基本常识(1)
目录
一、集合框架
1、什么是集合框架
2、集合框架的重要性
2.1开发中的使用
2.2笔试及面试题
3、背后涉及的数据结构以及算法
3.1什么是数据结构
3.2容器背后对应的数据结构
3.3相关java知识
3.4什么是算法
3.5如何学好数据结构以及算法
二、时间和空间复杂度
1、算法的效率
2、时间复杂度
2.1时间复杂度的概念
2.2大O的渐进表示法
2.3推导大O阶方法
2.4常见的时间复杂度计算举例
三、空间复杂度
一、集合框架
1、什么是集合框架
Java集合框架(Java Collection Framework),又被称为容器(container),是定义在java.util包下的一组接口(interfaces)和其实现类(classes).
主要表现为把多个元素(element)放在一个单元中,用于对这些元素进行快速、便捷的存储(store)、检索(retrieve)、管理(manipulate),即平时俗称的增删改查(CRUD)
类和接口总览:
2、集合框架的重要性
2.1开发中的使用
(1)使用成熟的集合框架,有助于我们便捷、快速的写出高效、稳定的代码
(2)学习背后的数据结构知识,有助于我们理解各个集合的优缺点及使用场景
2.2笔试及面试题
在各厂的秋招中,常会用数据结构作为笔试的考题;不仅如此,哪怕是在面试中,也常常会问到我们一些数据结构相关的问题!!!
3、背后涉及的数据结构以及算法
3.1什么是数据结构
数据结构(Data Structure)是计算机存储、组织数据的方式,指互相之间存在一种或多种特定关系的数据元素的集合
3.2容器背后对应的数据结构
在这里,我们主要学习以下容器,每个容器其实都是对某种特定数据结构的封装,大概了解一下,后序会给大家详细讲解并模拟实现:
(1)Collection:一个接口,包含了大部分容器常用的一些方法
(2)List:一个接口,规范了ArrayList和LinkedList中要实现的方法
ArrayList:实现了List接口,底层为动态类型顺序表
LinkedList:实现了List接口,底层为双向链表
(3)Stack:底层是栈,栈是一种特殊的顺序表
(4)Queue:底层是队列,队列是一种特殊的顺序表
(5)Deque:是一个接口
(6)Set:集合,是一个接口,里面放置的是K模型
HashSet:底层为哈希桶,查询的时间复杂度为O(1)
TreeSet:底层为红黑树,查询的时间复杂度为O( logN ),关于key有序的
(7)Map:映射,里面存储的是K-V模型的键值对
HashMap:底层为哈希桶,查询时间复杂度为O(1)
TreeMap:底层为红黑树,查询的时间复杂度为O(logN),关于key有序
3.3相关java知识
(1)泛型 (Generic)
(2)自动装箱 (autobox) 和自动拆箱 (autounbox)
(3)Object 的 equals 方法
(4)Comparable 和 Comparator 接口
3.4什么是算法
算法(Algorithm):就是定义良好的计算过程,他取一个或一组的值为输入,并产生出一个或一组值作为输出。简单来说算法就是一系列的计算步骤,用来将输入数据转化成输出结果。
3.5如何学好数据结构以及算法
不少人都会问:怎么才能学会学好数据结构呢???
(1)死磕代码,磕成这样就可以了
(2)注意画图和思考
在我看来,学数据结构主要分为这样的过程:
思考==>画图==>写代码(N)==>画图==>再次写代码==>调试==>……
#注:一定要画图!!!一定要画图!!!一定要画图!!!
(3)多看两遍我的博客或者自己写点的东西(如博客),多做总结
(4)多刷题
可以在牛客网和LeetCode上面刷一下相关的数据结构,看一下不同的解题思路!!!
二、时间和空间复杂度
首先要明确,我们不只是说只要可以实现、完成任务就可以,而是要尽可能用更少的时间、更少的空间来完成任务!!!(就像是干活一样,不仅要老板满意,还要在保证质量的情况下用最短的时间以及最少的成本完成工作,让利益最大化!!!)
1、算法的效率
算法效率分析分为两种:第一种是时间效率,第二种是空间效率。时间效率被称为时间复杂度,而空间效率被称作空间复杂度。时间复杂度主要衡量的是一个算法的运行速度,而空间复杂度主要衡量一个算法所需要的额外空间
(在计算机发展的早期,计算机的存储容量很小。所以对空间复杂度很是在乎。但是经过计算机行业的迅速发展,计 算机的存储容量已经达到了很高的程度。所以我们如今已经不需要再特别关注一个算法的空间复杂度。但是,一些面试题或者笔试题中有要求!!!)
2、时间复杂度
2.1时间复杂度的概念
时间复杂度的定义:在计算机科学中,算法的时间复杂度是一个数学函数,它定量描述了该算法的运行时间。一个算法执行所耗费的时间,从理论上说,是不能算出来的,只有你把你的程序放在机器上跑起来,才能知道。但是我们需要每个算法都上机测试吗?是可以都上机测试,但是这很麻烦,所以才有了时间复杂度这个分析方式。一个算法所花费的时间与其中语句的执行次数成正比例,算法中的基本操作的执行次数,为算法的时间复杂度。
2.2大O的渐进表示法
// 请计算一下func1基本操作执行了多少次?void func1(int N){int count = 0;for (int i = 0; i < N ; i++) {for (int j = 0; j < N ; j++) {count++;}}//N^2for (int k = 0; k < 2 * N ; k++) {count++;}//2*Nint M = 10;while ((M--) > 0) {count++;}//10System.out.println(count);}
Func1 执行的基本操作次数 :
F(N) = N^2 + 2*N + 10
(1)N = 10 F(N) = 130
(2)N = 100 F(N) = 10210
(3)N = 1000 F(N) = 1002010
实际我们计算时间复杂度时,我们只需要算大概执行的次数,也就是大O的渐进表示法
大O符号(Big O notation):是用于描述函数渐进行为的数学符号。
2.3推导大O阶方法
(1)用常数1取代运行时间中的所有加法常数(换常数)
(2)在修改后的运行次数函数中,只保留最高阶项(只保留最高相)
(3)如果最高阶项存在且不是1,则去除与这个项目相乘的常数。得到的结果就是大O阶。(系数变成1)
使用大O的渐进表示法以后,Func1的时间复杂度为:O(N^2)
(1)N = 10 F(N) = 100
(2)N = 100 F(N) = 10000
(3)N = 1000 F(N) = 1000000
通过上面我们会发现大O的渐进表示法去掉了那些对结果影响不大的项,简洁明了的表示出了执行次数。 另外有些算法的时间复杂度存在最好、平均和最坏情况:
最坏情况:任意输入规模的最大运行次数(上界)(最慢)
平均情况:任意输入规模的期望运行次数
最好情况:任意输入规模的最小运行次数(下界)(最快)
如:在一个长度为N数组中搜索一个数据x
最好情况:1次找到
最坏情况:N次找到
平均情况:N/2次找到
在实际中一般情况关注的是算法的最坏运行情况,所以数组中搜索数据时间复杂度为O(N)
2.4常见的时间复杂度计算举例
实例1:
void func3(int N, int M) {int count = 0; for (int k = 0; k < M; k++) {count++;//M} for (int k = 0; k < N ; k++) {count++;//N} System.out.println(count);}
由于基本操作执行了N+M次,并且两数都是未知数,所以时间复杂度为O(N+M)
实例二:
void bubbleSort(int[] array) {for (int end = array.length; end > 0; end--) {boolean sorted = true;for (int i = 1; i < end; i++) {if (array[i - 1] > array[i]) {Swap(array, i - 1, i);sorted = false;}//N*(N-1)/2} if (sorted == true) {break;}}}
由于循环执行,第一次执行(N-1)次,最后一次执行了0次,共N次,求每次比前一次少一次,因此得到N*(N-1)/2,因此时间复杂度为O(N^2)
实例三:
int binarySearch(int[] array, int value) {int begin = 0;int end = array.length - 1;while (begin <= end) {int mid = begin + ((end-begin) / 2);if (array[mid] < value)begin = mid + 1;else if (array[mid] > value)end = mid - 1;elsereturn mid;}return -1;}
二分查找,一次是原来的一半可以得出(N/2)^O=1,计算可得时间复杂度为O(logN)(logN是以2为底,lgN是以10为底)
实例四:
long factorial(int N) {return N < 2 ? N : factorial(N-1) * N;}
阶乘递归是在比较N和2的大小关系进行选择,可以发现共递归了N次,所以时间复杂度为O(N)
实例五:
int fibonacci(int N) {return N < 2 ? N : fibonacci(N-1)+fibonacci(N-2);}
我们可以发现,左侧最顶端(第一次)是(N-1),最后一次是1,也就可以得到近似的1+2^1+……+2^(N-1),也就是2^N-1,同理,右侧也可以计算出是2^(N-1)-1,因此时间复杂度为O(2^N)
我们常遇到的复杂度有:O(1) < O(logN) < O(N) < O(N*logN) < O(N^2)
三、空间复杂度
空间复杂度是对一个算法在运行过程中临时占用存储空间大小的量度 。空间复杂度不是程序占用了多少bytes的空间,因为这个也没太大意义,所以空间复杂度算的是变量的个数。空间复杂度计算规则基本跟时间复杂度类似,也使用大O渐进表示法。
实例一:
void bubbleSort(int[] array) {for (int end = array.length; end > 0; end--) {boolean sorted = true;for (int i = 1; i < end; i++) {if (array[i - 1] > array[i]) {Swap(array, i - 1, i);sorted = false;}}if (sorted == true) {break;}}
}
因为使用了常数个额外空间,所以空间复杂度为O(1)
实例二:
int[] fibonacci(int n) {long[] fibArray = new long[n + 1];fibArray[0] = 0;fibArray[1] = 1;for (int i = 2; i <= n ; i++) {fibArray[i] = fibArray[i - 1] + fibArray [i - 2];}return fibArray;}
因为动态开辟了N个空间,空间复杂度为 O(N)
实例三:
long factorial(int N) {return N < 2 ? N : factorial(N-1)*N;}
因为递归调用了N次,开辟了N个栈帧,每个栈帧使用了常数个空间,因此空间复杂度为O(N)
由于内容较多,会分为多篇讲解,预知后续内容,请看后续博客!!!