常见类型在内存中的存储
目录
常见类型在内存中的存储
1.整形
原码 反码 补码
为什么要整形以补码的形式存储?
大端和小端
整形在内存中的存储
2.字符
字符类型在内存中的存储
3.浮点型
浮点数存储规则
浮点型在内存中的存储
浮点案例
常见类型在内存中的存储
1.整形
原码 反码 补码
整形数据的二进制表示形式有三种:原码、反码、补码。
三种表示方法均由符号位和数值位两部分组成,其中符号位用0表示"正",用1表示“负”。
正数的原、反、补都相同。
负数的三种表示方法各不相同。
原码
直接将数值按照正负数的形式翻译成二进制就可以得到原码。
反码
将原码的符号位不变,其它位依次按位取反就可以得到反码。
补码
反码加一就能得到补码。
从其定义不难看出:
补码减一,符号位不变其余按位取反可以得到原码。(补码符号位不变其余按位取反再加一也可以得到原码。)
对于整数来说,数据存的就是补码。
为什么要整形以补码的形式存储?
假如计算机要计算1-1等于多少:
将其变形为1+(-1)
1的原码为:00000000 00000000 00000000 00000001
-1的原码为:10000000 00000000 00000000 00000001
两者原码相加为:10000000 00000000 00000000 00000010
翻译过来也就是:-2
1的补码为:00000000 00000000 00000000 00000001(正数的原码和补码相同)
-1的补码为:11111111 11111111 11111111 11111111
两者原码相加为:1 00000000 00000000 00000000 00000000
由低地址位截取32位:00000000 00000000 00000000 00000000(补码)
00000000 00000000 00000000 00000000(原码)
翻译过来也就是:0
原码计算是错误的
补码计算是正确的
大端和小端
在上面计算1+(-1)时,-1和1的补码相加为:1 00000000 00000000 00000000 00000000
明显超出了int所表示的32位的范围,可是为什么我们会从低地址(从前到后为高地址到低地址)位开始截取呢?这是因为我所在的设备采用的是小端存储,此外还有大端存储。那什么是小端存储和大端存储呢?
两者全名为大端字节序存储和小端字节序存储。取名来源于《格列夫游记》:两个国家因为鸡蛋从大头剥还是小头剥而打了一仗。人们受此影响取名为大端字节序存储和小端字节序存储。
字节序
是以字节为单位,讨论存储顺序的
小端字节序存储:
把一个数据的低位字节的内容,存放在低地址处,把一个数据的高位字节的内容,存放在高地址处。
大端字节序存储:
把一个数据的低位字节的内容,存放在高地址处,把一个数据的高位字节的内容,存放在低地址处。
如何通过程序判断当前机器是大端存储还是小端存储?
#include <stdio.h>
int main()
{int a = 1;// 0000 0000 0000 0000 0000 0000 0000 0001char* p = (char*)&a;// 指针存放的是该类型第一位的地址// 由于int*所表示的范围为四个字节,该情况只需拿到第一位的即可,所有用char*if (*p == 1)printf("小端");elseprintf("大端");return 0;
}
整形在内存中的存储
以VS2022整形10和-10举例
#include <stdio.h>
int main()
{int num = 10;int num2 = -10;return 0;
}
分析:
整形在内存中存储的为补码
num的补码为:00000000 00000000 00000000 00001010
num2的补码为:11111111 11111111 11111111 11110110
换成十六进制
num : 00 00 00 0a
num2:ff ff ff f6
由于我的机器是以小端的方式存储,所以num,num2应是这样存储的:
num :0a 00 00 00
num2:f6 ff ff ff
验证:
通过F10启动调试,至return这一步
打开调试窗口
输入&num和&num2
num:
num2:
可以看到分析没有问题。除int外,整形还有长整型long(4/8bit)和短整型short(2bit)都和int同理,都可以通过上面的方式分析。
2.字符
字符类型在内存中的存储
char类型没有整形那样麻烦,字符在内存中存储的都是其ascll编码的值。
如b的ascll编码值为98,换成16进制为62。同样在VS上使用以上方法推测
这里为大家推荐一个快速查看ascll编码的网站:查看字符编码(UTF-8)
3.浮点型
浮点数存储规则
浮点型存储有一套独有的公式:(-1)^S*M*2^E
根据国际标准IEEE(电气和电子工程学会)754,任意一个二进制浮点数V可以表示成下面的形式:
- (-1)^S*M*2^E
- (-1)^S表示符号位,当S=0,V为正数;当S=1,V为负数
- M表示有效数字,大于等于1,小于2
- 2^E表示指数位
IEEE 754规定:
float(32bit)存储情况:
double(64bit)存储情况:
IEEE 754对有效数字M和指数E,还有一些特别规定。
前面说过,1<=M<2,也就是说,M可以写成1.xxxxxx的形式,其中xxxxxx表示小数部分。
IEEE 754规定,在计算机内部保存M时,默认这个数的第一位总是1,因此可以被舍去,只保存后面的xxxxxx部分。比如保存1.01的时候,只保存01,等到读取的时候,再把第一位的1加上去。这样做的目的是节省1位有效数字。以32位浮点数为例,留给M只有23位,将第一位的1舍去以后,等于可以保存24位有效数字。
至于指数E,情况就比较复杂。
首先,E为一个无符号整数(unsigned int)
这意味着,如果E为8位,它的取值范围为0~255;如果E为11位,它的取值范围为0~2047.但是,为我们知道,科学计数法中的E是可以出现负数的,所以IEEE 754规定,存入内存时的E的真实值必须再加上一个中间数,对于8位的E,这个中间数是127;对于11位的E,这个中间数是1023.比如,2^10的E是10,所有保存成32位浮点数时,必须保存成10+127=137,即10001001。
然后,指数E从内存中取出还可以再分成三种情况:
E不全为0或不全为1
这时,浮点数就采用下面的规则表示,即指数E的计算值减去127(或1023),得到真实值,再将有效数字M前加上第一位的1。
比如:
0.5(1/2)的二进制形式为0.1,由于规定正数部分必须为1,即使小数点右移1位,则为1.0*2^(-1),其阶码为-1+127=126,表示01111110,而尾数1.0去掉整数部分为0,补齐0到23为00000000000000000000000,则其二进制表示形式为:
0 01111110 00000000000000000000000
E全为1
这时,浮点数的指数E等于1-127(或者1-1023)即为真实值,有效数字M不再加上第一位的1,而是还原为0.xxxxxx的小数。这样做是为了表示±0,以及接近于0的很小的数字。
E全为0
这时,如果有效数字M全为0,表示±无穷大(正负取决于符号位s);
浮点型在内存中的存储
这里以5.5举例
int main()
{float f = 5.5;// 101.1// 1.011 * 2^2// (-1)^0 * 1.011 * 2^2// S=0// M=1.011// E=2// 0 10000001 01100000000000000000000// 0100 0000 1011 0000 0000 0000 0000 0000// 4 0 b 0 0 0 0 0// 0x40b00000return 0;
}
分析:
这是一块为内存上为float开辟的空间:
先将5.5换成二进制得到:101.1,也就是1.011 * 2^2
用公式(-1)^S*M*2^E的表达也就是:(-1)^0 * 1.011 * 2^2
从而可以知道S=0,M=1.011,E=2
由于S=0,我们可以知道S对应空间中存放的为0
其中E=2,因为这是float类型,所以将其加上127得到129,而129的二进制为:1000 0001
那么E对应空间上顿饭的就是1000 0001
M为1.001,按照规则,M上存储的应为001,后面低地址位补0
从而我们知道了该空间存储的为:01000000 10110000 00000000 00000000
以小端16进制存储为:00 00 b0 40
验证:
浮点案例
#include <stdio.h>
int main()
{int n = 9;// 00000000000000000000000000001001// 0 00000000 00000000000000000001001// S E M// 0 -126 0.00000000000000000001001// (-1)^0 * 0.00000000000000000001001 * 2^(-126)// E为全0float* pFloat = (float*)&n;printf("num的值为:%d\n", n);printf("*pFloat的值为:%f\n", *pFloat);// %f只打印小数点后6位*pFloat = 9.0;// 1001.0// 1.001 * 2^3// (-1)^0 * 1.001 * 2^3// S=0 M=001 E=3// 0 10000010 00100000000000000000000 补码printf("num的值为:%d\n", n);printf("*pFloat的值为:%f\n", *pFloat);return 0;
}