【C语言】万字肝爆！建议收藏！深度剖析数据在内存中的存储

文档中心

文章目录

前言
- - 正文开始
  - 类型的基本归类
  - 整形在内存中的存储
  - 大端小端
  - 做题目巩固
  - - 第一题：
    - 第二题：
    - 第三题:
  - 补充(char的取值范围)
  - - 第四题：
    - 第五题
    - 第六题

前言

数据在内存中到底是怎么存储的呢？相信看完这篇文章你的内功又会增加一点。

本文重点：

1. 数据类型详细介绍

2. 整形在内存中的存储：原码、反码、补码

3. 大小端字节序介绍及判断

4. 浮点型在内存中的存储解析

正文开始

我们大家最容易接触的内置类型：

char //字符数据类型
short //短整型
int //整形
long //长整型
long long //更长的整形
float //单精度浮点数
double //双精度浮点数

那么这些类型有什么意义呢?

确认这些类型在内存开辟的空间大小，比如 int类型 4字节
看待内存的视角，int类型是整形，float类型是浮点型

类型的基本归类

- 整形家族：

char
unsigned char
signed char
short
unsigned short [int]
signed short [int]
int
unsigned int
signed int
long
unsigned long [int]
signed long [int]

为什么char类型放在整形里面?

其实字符类型在底层存储，存的是ASCII码值，ASCII码值也是整数

unsigned(无符号)

未来你要创建一个变量，变量只会存正数，没有可能有负数的情况，那么你可以创建一个unsigne的类型

signed (有符号)

有符号位，也就是有正负之分

- 浮点类型家族：

float
double

- 构造类型家族（自定义类型）：

结构体类型 struct
枚举类型 enum
联合类型 union
数组类型

为什么数组类型也是自定义类型?

定义一个数组 int arr [10] ，我们知道数组去掉它的数组名剩下的就是类型了， int [10] <— 这个就是我们自定义的类型

定义int arr [ 5 ]，去掉数组名int [5]，可以看见他们都是int类型，但是int [10]和int[5] 不一样，所以说数组类型也属于自定义类型

- 指针类型：

float*p
char*p
void*p
int*p

- 空类型：

void 表示空类型（无类型）
通常应用于函数的返回类型、函数的参数、指针类型。

整形在内存中的存储

我们之前讲过一个变量的创建是要在内存中开辟空间的。空间的大小是根据不同的类型而决定的。

那接下来我们谈谈数据在所开辟内存中到底是如何存储的？

int a = -10;

问题一：看了上面的代码我们知道 a 是int类型占4个字节，那在如何存储的呢？

首先我们要来了解下面的概念：

数据在内存中以二进制的形式存储
计算机中的有符号数有三种表示方法，即原码、反码和补码。

三种方法都有符号位和数值位

符号位 : 符号位都是用0表示“正”，用1表示“负”
数值位 : 数值位三种表示方法各不相同

对于整数来说：

整数的二进制有3种表示形式：原码，反码，补码

正整数：原码，反码，补码相同

负整数：原码，反码，补码要进行计算

原码：按照数值直接写出来的二进制序列就是原码
反码：原码的符号位不变，其他位按位取反，得到的就是反码
补码：反码加1，就是补码

好了，知道以上的一些概念，让我们回到问题一看看我们的int a在内存是怎么存储的

先编译器取A的内存
输入&a 得到 f6 ff ff ff

为什么是 f6 ff ff ff 呢?让我们来按照上面的步骤来探究一下：
获取a的原码
-10
原码：10000000 00000000 00000000 00001010
获取a反码
反码：11111111 11111111 11111111 11110101
获取a的补码
反码: 111111111 111111111 111111111 11110110

上面说到为什么是f6 ff ff ff
对于整形来说：数据存放内存中其实存放的是补码，怎么证明呢？

在这里插入图片描述
可以看见把刚刚计算出来的补码放在计算器里面得到的就是一个16进制的FFFFFFF6 ，只是顺序有点倒过来了，不过的确可以证明对于整形来说：数据存放内存中其实存放的是补码

问题二：为什么要存补码呢？为什么不存原码呢?

在计算机系统中，数值一律用补码来表示和存储。原因在于，使用补码，可以将符号位和数值域统一处理；同
时，加法和减法也可以统一处理（CPU只有加法器）此外，补码与原码相互转换，其运算过程是相同的，不需
要额外的硬件电路。

其实就是说补码补码相加才可以得到一个准确的数值，看不懂上面的？没事

来个代码：1-1 因为CPU只有加法器 , 所以就是1+(-1)

1-11+(-1)  （CPU只有加法器)

我们试一下错误的：原码相加会等到正确的值吗？

1 的原反补相同：00000000 000000000 00000000 000000001
-1的原码 : 10000000 000000000 00000000 000000001

二进制原码相加:
00000000 00000000 00000000 00000001
10000000 00000000 00000000 00000001

得到下面这个数：
10000000 00000000 00000000 00000010
认为这个是正确的数，那我们读出来就是 -2 了，1 - 1 = 0，最后是-2肯定是错误的。

我们试一下正确的：补码相加会等到正确的值吗？

1的原反补相同：00000000 000000000 00000000 000000001

来算一下负1的补码：

-1的原码：10000000 00000000 00000000 00000001

-1的反码：1111 1111 1111 1111 1111 1111 1111 1110

-1的补码：1111 1111 1111 1111 1111 1111 1111 1111

二个数的补码相加：
【C语言】万字肝爆！建议收藏！深度剖析数据在内存中的存储

得到：10000000 00000000 00000000 000000000
32个0，一个1 ，我们实际上只可以放32个二进制数，那个进1的那位要丢掉，所以最后得到全0，而 1-1 的 正确结果也是 0.
【C语言】万字肝爆！建议收藏！深度剖析数据在内存中的存储

这就是为什么要补码相加,而不是原码，或者反码相加的原因。

补码与原码相互转换，其运算过程是相同的，不需要额外的硬件电路

这句话怎么理解呢？看下面的案列：

【C语言】万字肝爆！建议收藏！深度剖析数据在内存中的存储

-1的补码要是想得到原码，可以反过来计算，补码-1，然后按位取反就可以得到。

那其实还有一种方法可以验证我们上面引用的话：

我们把补码当原码，在过一次计算一次依然可以得到我们的原码.

【C语言】万字肝爆！建议收藏！深度剖析数据在内存中的存储
是不是和上面的原码一样了,这就解释了上面所说的话了。

大端小端

为什么要有大端小端：

为什么会有大小端模式之分呢？这是因为在计算机系统中，我们是以字节为单位的，每个地址单元都对应着一
个字节，一个字节为8bit。但是在C语言中除了8bit的char之外，还有16bit的short型，32bit的long型（要看具
体的编译器），另外，对于位数大于8位的处理器，例如16位或者32位的处理器，由于寄存器宽度大于一个字
节，那么必然存在着一个如果将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。
例如一个 16bit 的 short 型 x ，在内存中的地址为 0x0010 ， x 的值为 0x1122 ，那么 0x11 为高字节， 0x22
为低字节。对于大端模式，就将 0x11 放在低地址中，即 0x0010 中， 0x22 放在高地址中，即 0x0011 中。小
端模式，刚好相反。我们常用的 X86 结构是小端模式，而 KEIL C51 则为大端模式。很多的ARM，DSP都为小
端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式

啊这，太官方话了。。。。简单说就是你的数值大于一个字节，就会有字节存储顺序，所以要安排怎么把这些字节按照什么顺序放进去

什么是大端小端：

大端（存储）模式：是指数据的低位保存在内存的高地址中，而数据的高位，保存在内存的低地址中；
小端（存储）模式：是指数据的低位保存在内存的低地址中，而数据的高位,，保存在内存的高地址中。

来个代码案列：

定义了一个变量：

【C语言】万字肝爆！建议收藏！深度剖析数据在内存中的存储

来看一下这个a在本机是什么存储模式，是大端存储模式，还是小端存储模式

我们画个图，模拟一下这个变量在内存中是怎么样存储的。

在这里插入图片描述

为什么说上面的是大端存储模式，下面是小端存储模式呢?

可以看见0x11223344 最后面的44是低位，然后在大端存储模式下44是放在内存的高地址位，根据上面的概念可以得出，大端模式，低位在内存的高地址存储就是大端模式。

为什么下面是小端存储模式：
0x11223344 44是放在内存的低地址处，根据上面的概念可以得出，小端模式，低位在内存的低地址存储就是小端模式。

那么我们当前的电脑上使用的是什么存储模式呢?来让我们一起看看
【C语言】万字肝爆！建议收藏！深度剖析数据在内存中的存储
诶！！！大家可以看见原来在本机上使用的是小端存储！

在这里插入图片描述
还记得这个FFFF FFF6吗，也是小端存储模式，所以说为什么有时候看内存是倒着的，就是因为这个大小端原因。

来做一道百度2015年的笔试题：

请简述大端字节序和小端字节序的概念，设计一个小程序来判断当前机器的字节序。（10分）

答案：简述的概念我们就不讲了，来看一下小程序吧

思路：我们只要判断第一个字节是小端应该出现的字节就是小端，是大端应该出现的字节就是大端，

我们先看一下1在小端内存是怎么表示的：
【C语言】万字肝爆！建议收藏！深度剖析数据在内存中的存储
可以看见第一个字节是01 也就是1 所以我们代码看一下写成这样判断

int main(){//写代码判断当前字节序int a = 1;     //在小端应该是这样的存储 01 00 00 00char* b =(char*) &a;  //取出第一个字节的内容 if (*b==1) {printf("小端");}else {printf("大端");}return 0;}

也可以写成函数的那样：

int check_sys(){int a = 1; return (*(char*)&a);  //因为返回的是1 或者0 也是&a的内容 所以可以直接rerunt}int main(){int ret  =check_sys();if (ret == 1 ){printf("小端");}else{printf("大端");}return 0;}

做题目巩固

第一题：

1.//输出什么？#include int main(){char a= -1;signed char b=-1;unsigned char c=-1;printf("a=%d,b=%d,c=%d",a,b,c);return 0;}

答案：-1 ， -1 ，255

解析:（a）-1的由来

-1在内存中存的是补码
-1的原码:10000000000000000000000000000001
-1的反码:11111111111111111111111111111110
-1的补码:11111111111111111111111111111111
因为a是char类型只可以放8个bit为所以a里面应该存的是 8个1
再因为输入打印是以%d类型打印的所以要发生整形提升，有符号位发生提升前面全补1
11111111变成11111111111111111111111111111111 —这个是补码
还要变成原码的方式输出出去：

a的补码11111111111111111111111111111
a的反码11111111111111111111111111110
a的原码10000000000000000000000000000001
最后打印的是原码：-1

b其实也是一样的有符号的-1

解析（c）255的由来
因为c是unsigned char类型只可以放8个bit为所以a里面应该存的是 8个1。
再因为输入打印是以%d类型打印的所以要发生整形提升，无符号位发生提升前面全补0。

11111111变成00000000000000000000000011111111 —这个是补码
看符号位是0，判断它是一个正数，所以正数的原反补相同，最后已原码打印出来的是8个1 也就是255
在这里插入图片描述
补充：char 到底是signed char 还是unsigned char ？
答：C语言标准并没有规定，取决于编译器
int 是 signed int

第二题：

2.#include int main(){char a = -128;printf("%u\n",a);return 0;}

答案是：4294967168

解析:

a的原码：10000000000000000000000010000000
a的反码：11111111111111111111111101111111
a的补码：11111111111111111111111110000000

因为a是char类型，所以a里面存放的应该是8个bit位： 10000000
以%u形式输出出来，要发生整形提升,看见a是char类型是有符号的，高位补1，得到：11111111111111111111111110000000，最后发现是以%u的类型打印出来，可%u是无符号类型，就意味着，这是个正数，正数的原反补相同，所以是168结尾的大数字
在这里插入图片描述

第三题:

#include int main(){char a = 128;printf("%u\n",a);return 0;}

答案：4294967168

解析：和上面一样
注意：char a =128， 其实a不可能放一个128,127后就是-128了

补充(char的取值范围)

char取值范围是：-128 ~ 127

为什么？

画图解释一下：

char是8个bit位，所以在内存应该是这样的：
在这里插入图片描述
因为01111111已经是最大的正数了，在加1最高位变成1的话，那就变成负数了，01111111 == 127。

在这里插入图片描述

如果01111111加1那么就变成了10000000，当然这个数并不是0，而是-128，遇见一个1，七个0都是-128，因为这里的二进制数不可以计算原反补码了，但是其他的就不一样。（负数是要进行原反补的）
在这里插入图片描述
补码:11111110通过原反补的计算得到 -2
反码：11111101 补码减1得反码
原码：1000010 == -2 反码取反得原码

第四题：

int i= -20;unsigned int j = 10;printf("%d\n", i+j);

答案：-10
解析：求出-20 和 10的补码相加然后%d打印认为是有符号，还要计算出原码打印出来。

i的原码:10000000000000000000000000010100
i的反码:11111111111111111111111111101011
i的补码:11111111111111111111111111101100
j的补码:00000000000000000000000000001010

【C语言】万字肝爆！建议收藏！深度剖析数据在内存中的存储

因为%d打印的所以还要取出原码
【C语言】万字肝爆！建议收藏！深度剖析数据在内存中的存储

最终是-10

第五题

unsigned int i;for(i = 9; i >= 0; i--){printf("%u\n",i);}

答案：死循环

解析: 因为i是一个无符号数字，对于一个无符号数字最小是0，判断条件刚好是大于等于0，所以恒成立“，所以死循环

第六题

int main(){char a[1000];int i;for(i=0; i<1000; i++){a[i] = -1-i;}printf("%d",strlen(a));return 0;}

答案 :255

解析：strlen找到 \0 停止，从-1 到 127 因为char的范围是-128~127 所以128+127 = 255
在这里插入图片描述
第七题

#include unsigned char i = 0;int main(){for(i = 0;i<=255;i++){printf("hello world\n");}return 0;}

答案: 死循环
解析：无符号的char 取值符号是255 没有正反区分，条件刚好是大于等于255 ，所以死循环
在这里插入图片描述

本文结束，感谢大家的观看!!!感觉对你有用的话，不妨点个大拇指

【C语言】万字肝爆！建议收藏！深度剖析数据在内存中的存储

文章目录

前言

正文开始

类型的基本归类

整形在内存中的存储

大端小端

做题目巩固

第一题：

第二题：

第三题:

补充(char的取值范围)

第四题：

第五题

第六题

公告

DeepSeek全套部署资料免费下载

免费可商用字体批量下载

标签

【C语言】万字肝爆！建议收藏！深度剖析数据在内存中的存储

文章目录

前言

正文开始

类型的基本归类

整形在内存中的存储

大端小端

做题目巩固

第一题：

第二题：

第三题:

补充(char的取值范围)

第四题：

第五题

第六题

相关问题

公告

DeepSeek全套部署资料免费下载

免费可商用字体批量下载

标签