【C初阶】数据在内存中的存储
目录
1. 整数在内存中的存储
2. 大小端字节序
2.1 什么是大小端?
2.2 为什么有大小端?
2.3 练习
2.3.1 练习1
2.3.2 练习2
2.3.3 练习3
2.3.4 练习4
2.3.5 练习5
2.3.6 练习6
3. 浮点数在内存中的存储
3.1 浮点数存储的过程
3.2 浮点数的取出过程
1. 整数在内存中的存储
在操作符的那一章的时候,我们就学习了一下内容,不清楚的小伙伴可以返回去看看。
整数的2进制表示方法有三种:原码、反码、补码。
有符号整数,三种表示方法都有符号位和数值位两部分,符号位0表示正,1表示负,最高位表示符号位,其他的表示数值位。
正整数原码、反码、补码都是相同的。负整数则是各不相同。
其规则为:原码:将数值按照正负数的形式翻译为2进制得到的就是原码。
反码:原码的符号位不变,其他位按位取反就可以得到反码。
补码:反码+1得到的就是补码。
对于整型来说,数据存放在内存中存放的是二进制的补码。
2. 大小端字节序
我们之前在调试过程中,在查看内存情况时,会有疑惑为啥它是倒着储存的,其实这里面有它自己的规则。
其实没必要大惊小怪,有的是正着排的,有的是倒着排的。这就有关于大小端字节序的判断了。
2.1 什么是大小端?
其实超过一个字节的数据在内存中存储的时候,就有存储顺序的问题,按照不同的存储顺序,我们分为大端字节存储和小端字节存储,下面是具体概念:
大端存储模式: 是指数据的低位字节内容保存在内存的高地址处。而数据的高位字节内容,保存在内存的低地址处。
小端存储模式: 是指数据的低位字节内容保存在内存的低地址处,而数据的高位字节内容,保存在内存的高地址处。
这里是要记住的,方便进行区分。
2.2 为什么有大小端?
那么为什么会有大小端之分呢?直接正着存不是更方便吗?
这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一个字节,一个字节8个bit位,但是在C语言中除了8bit的char之外,还有16bit的short型,32bit的long型(具体要看编译器),另外,对于位数大于8位的处理器,由于寄存器宽度大于1个字节,那么必然存在着一个如何将多个字节安排的问题,因此就导致了大端字节存储模式和小端存储模式。
2.3 练习
2.3.1 练习1
简述大小端的概念,并设计一个程序检测当前机器是什么模式。
答:大端:低位字节内容存放在高地址处,高位字节内容存放在低地址处。
小端:低位字节内容存放在低地址处,高位字节内容放在高地址处。
int check_sys()
{int i = 1;return ((char*)&i);
}
int main()
{if (check_sys() == 0)printf("大端\n");elseprintf("小端\n");
}
2.3.2 练习2
int main()
{char a = -1;signed char b = -1;unsigned char c = -1;printf("a = %d, b = %d, c = %d \n", a, b, c);return 0;
}
我们来看看这段代码会打印什么值?
在计算这段代码之前,我们先了解一下相关知识。
char :-128~127
signed char :-128~127
unsigned char:0~255
这些范围是怎么产生的?为什么就是这个范围,请看下图:
这是char的,short、int这些类型都可以以此类推。有了这些知识,我们来解答这道题。
2.3.3 练习3
int main()
{char a = -128;printf("%u\n", a);return 0;
}
%u -- 打印的是无符号整型
int main()
{char a = -128;// 10000000 00000000 00000000 10000000// 11111111 11111111 11111111 01111111// 11111111 11111111 11111111 10000000// 10000000 - a// 11111111 11111111 11111111 10000000// 4294967168printf("%u\n", a);return 0;
}
2.3.4 练习4
int main()
{char a[1000];int i = 0;for (i = 0; i < 1000; i++){a[i] = -1 - i;}printf("%d\n", strlen(a));return 0;
}
不难看出,他直接就是-128~127,也就是255.
2.3.5 练习5
int main()
{unsigned char i = 0;for (i = 0; i <= 255; i++){printf("hello world\n");}return 0;
}
代码死循环了,因为i<=255这个条件是恒成立的。
2.3.6 练习6
int main()
{int a[4] = { 1,2,3,4 };int* ptr1 = (int*)(&a + 1);int* ptr2 = (int*)((int)a + 1);printf("%x, %x", ptr1[-1], *ptr2);return 0;
}
解题过程:
所以答案是4,2000000 小伙伴们答对了吗?
3. 浮点数在内存中的存储
浮点数有很多,比如说3.14159,1E10等。
我们先来看个例子:
int main()
{int n = 9;float* pFloat = (float*)&n;printf("n的值为:%d\n", n);printf("pFloat的值为:%f\n", *pFloat);*pFloat = 9.0;printf("n的值为:%d\n", n);printf("pF的值为:%f\n", *pFloat);return 0;
}
输出是什么呢?
可以得出:浮点数在内存中的存储和整数是不同的。
3.1 浮点数存储的过程
上面的代码中,n和*pFloat在内存中存储的明明是同一个数,为什么浮点数和整数的解读结果会差别那么大?
要理解这个结果,我们需要 搞懂浮点数在计算机内部的表示方法。
根据国际标准IEEE(电气和电子工程协会)754,任意一个二进制浮点数V可以表示为下面的形式:
V = (-1)^S * M * 2^E
(-1)^S表示符号位,当S=0,V为正数;当S=1,V为负数
M表示有效数字,M是大于等于1,小于2的
2^E表示的是指数位
举例来说:
十进制的5.0,写成二进制是101.0 -- 1.01*2^2。
那么,按照上面V的格式,可以得出S=0,M = 1.01,E = 2。
IEEE754规定:
对于32位的浮点数(float),最高的1位存储符号位S,接着的8位存储指数E,剩下的23位存储有效数字M。
对于64位的浮点数(double),最高的1位存储符号位S,接着的11位存储指数E,剩下的52位存储有效数字M。
IEEE754对有效数字M和指数E,还有一些特别的规定。
前面说过,1 <= M < 2,也就是说M可以写成1.xxxxxx的形式,其中xxxxxx表示小数部分。
IEEE754规定,在计算机内部保存M时,默认这个数第一位总是1,因此可以舍弃,只保存后面的小数部分。比如说保存1.01时,只保存01,等到读取的时候,再把第一位的1加上去,这样做的目的,是节省1位有效数字。以32位浮点数为例,留给M只有23位,将第1位舍弃后,可以保存24位有效数字。
E是一个无符号整数(unsigned int)
这意味着,如果E为8位,它的取值范围是0~255;如果E为11位,它的取值范围为0~2047.但是,我们知道,科学计数法中的E是可以出现负数的,所以IEEE754规定,存入内存的E真实值必须再加上一个中间数,对于8位的E,这个中间数是127;对于11位的E,这个中间数是1023.
就拿9.5举个例子:
浮点数是有可能无法精确保存的,比如说1.2。
3.2 浮点数的取出过程
E不全为0或不全为1(常规情况)
这时,指数E的计算值-127(或1023),得到真实值,再将有效数字M前加上第1位的1。
E全为0
E等于1-127(或1-1023)即为真实值,有效数字M不再加上第一位的1,而是还原为0.xxxxxx的小数,这样做是为了表示接近0很小的数字。
E全为1
如果有效数字M全为0,表示无穷大;