【C语言进阶】自定义类型详解

文档中心

🔥 🔥 🔥 🔥 🔥 🔥 🔥 🔥 C进阶系列全力更新中，火速订阅【C语言进阶，这一篇就够了】🔥 🔥 🔥 🔥 🔥 🔥 🔥 🔥

文章目录

前言
一、结构体
- 1.结构的基础知识
- 2.结构体的声明
- 3.匿名结构体
- 4.结构体的自引用
- 5.结构体变量的定义和初始化
- 6.结构体内存对齐
- 7.修改默认对齐数
- 8.offsetof宏
- 9.结构体传参
- 10.结构体实现位域（位段）
- - 10.1位域的说明
  - 10.2位域的定义
  - 10.3位域的内存分配
二、枚举
- 1.枚举的定义
- 2.枚举的优点
- 3.枚举的使用
三、联合体（共用体）
- 1.联合体简介
- 2.联合体的声明和定义
- 3.联合体的初始化
- 4.联合体大小的计算
- 5.联合体应用

前言

本章来剖析C语言自定义的数据类型：结构体、枚举、位段、联合体（共用体）。自定义数据类型就是用户可以随时在程序中自行定义新的数据类型。

一、结构体

我们知道数组允许存储相同数据类型的变量，当我们想要存储不同数据类型的变量时，我们就要用到结构，结构是C编程中一种自定义的数据类型。
前面我们已经学习过结构体入门篇，在此简略复习，若有需要，猛戳👉【C语言入门必看】结构体👈

1.结构的基础知识

结构体是一些值的集合，这些值称为成员变量。结构体的每个成员可以是不同类型的变量。

2.结构体的声明

在这里插入图片描述
💬应用： 描述一个复杂对象，比如一个学生（有姓名，年龄，性别，学号）

struct Stu{char name[20];//姓名int age;//年龄char sex[10];//性别char id[30];//学号}s1, s2;struct Stu s3;//s1,s2,s3是结构体全局变量int main(){struct Stu s4;struct Stu s5;struct Stu s6;//s4,s5,s6是结构体局部变量return 0;}

🔍分析： s1~s6都是结构体变量，以在main的外面或里面来区分全局还是局部。

3.匿名结构体

所谓匿名，可以理解为无名，即没有标签名的结构体。
【C语言进阶】自定义类型详解

📣匿名结构体的声明：

struct{char a;int b;float c;}s; //匿名结构体变量sstruct{char a;int b;float c;}*ps;//匿名结构体指针*psint main(){ps = &s;return 0;}

用匿名结构体的方式创建了结构体变量s和结构体指针ps，而且仔细发现：他们的成员变量是相同的。
所以当执行ps = &s;，这是合情合理的吗？我们运行上面代码发现：
【C语言进阶】自定义类型详解
这并非合理
🔑解释： 编译器认为，虽然你俩的成员变量相同，但名字我都不晓得，为了安全起见，所以不能让你俩搁这赋值，即认为两者是不同的类型。最终发出警告：两者的类型不兼容
注意事项：匿名结构体没有tag标签名，因此无法构成结构体类型，所以匿名结构体只能用一次（你没名字，我上哪找你去？😾）

4.结构体的自引用

结构体包含一个由该结构体类型创建的结构体变量，是否可以？

struct N{char a;struct N n;};

🔍分析： 假设该做法是可行的，当struct N结构体类型创建一个结构体变量a，那该如何计算结构体变量a的大小呢？因为a变量有struct N n;//结构体变量n，而结构体变量n中又有struct N n;//结构体变量n，这不就相当于山里有座庙，庙里有个老和尚…的故事吗？搁这套娃呢！【C语言进阶】自定义类型详解

🚀运行结果：
编译器会报错
【C语言进阶】自定义类型详解
事实上，结构体N还没定义完，因为编译器并不知道结构体N需要多少空间存储。
💯正确的结构体自引用是这样的：

struct N{char a;struct N* n;};

🔍 分析： 结构体N中定义了一个指针，该指针指向一个结构体N类型。
为什么可以这样做呢？在指针篇我们知道，无论是哪一种类型的指针，指针的大小是固定的（32位平台为4字节，64位平台为8字节），因此编译器在编译的时候就知道结构体指针n的大小并为其分配空间。

📚为了更加清晰地理解，在此进行拓展（数据结构的单链表知识）：
当我们想要存储 1 2 3 4 ，我们可以用数组（在数据结构中称为顺序表），另外一种方法就是单链表。
在这里插入图片描述

单链表十分巧妙地利用了结构体自引用，具体代码：

struct Node{int data;struct Node* next;//next指针 指向下一个节点};

📌注意事项：
①匿名结构体不能自引用

typedef struct{char a;N* n;}N;

🚀运行结果：
【C语言进阶】自定义类型详解
🔑解释： 定义指针n时，结构体名N还未可见，编译器会报错"N"未定义。
🔱解决方法： 加上标签名

📚拓展（可跳过）：结构体的互引用

结构体的互引用：一个结构体A中包含一个或多个与结构体B相关的成员, 且结构体B中也包含一个或多个与结构体A相关的成员。
先看一个结构体互引用的错误用法❌：

struct A{int a;struct B* b;};struct B{int b;struct A* a;};

为啥错呢？有了上面的经验，我们可以分析，在定义结构体A的成员b时，由于结构体B还未可见，故编译器会会报数据类型B未定义。
💯解决方法是使用不完整声明：

struct B;//不完整声明：使结构体B可见，但先不告知B的具体定义struct A{int a;struct B* b;};struct B{int b;struct A* a;};

再看互引用的另一个错误用法❌：

struct B;//不完整声明：使结构体B可见，但先不告知B的具体定义struct A{    int a;    struct B b;};struct B{    int b;    struct A a;};

该错误和自引用中的套娃类似，结构体A和结构体B都是直接包含了对方，他俩搁这搁这搁这…永无止境
所以使用互引用要注意❕：至少有一个结构体必须在另一个结构体中以指针的形式被引用。

5.结构体变量的定义和初始化

创建局部/全局结构体变量并初始化：

struct Stu{char name[20];//名字int age;//年龄char sex[5];//性别char id[20];//学号}s1;//①声明类型的同时定义变量s1struct Stu s2;//定义全局变量s2struct Stu s3 = { "李四",20,"女","20200360317" };//定义全局变量s3并初始化int main(){struct Stu s4;//③定义局部变量s4struct Stu s5 = { "张三",17,"男","20200360318" };//④定义结构体变量s5的同时可初始化return 0;}

结构体（嵌套有结构体）的初始化和成员访问：

struct Writer{char name[20];int age;};struct Book{char name[20];int price;char id[20];struct Writer w;//结构体内嵌结构体};int main(){struct Book b = { "法外狂徒", 1000, "007", { "张三", 69 } };//初始化//访问成员//1.使用.printf("%s %d %s %s %d\n", b.name, b.price, b.id, b.w.name, b.w.age);//2.使用->struct Book* pb = &b;//定义一个结构体类型的指针指向b的地址 printf("%s %d %s %s %d\n", pb->name, pb->price, pb->id, pb->w.name, pb->w.age);return 0;}

6.结构体内存对齐

到此，我们已掌握了结构体的基本使用。现在我们深入讨论一个问题：计算结构体的大小，这也是一个特别热门的考点：结构体内存对齐

💬举个例子：

struct S{char a;int b;};int main(){struct S s1 = { 0 };printf("%d", sizeof(s1));return 0;}

有些同学眼睛都不睁开，大喊这简单，我会，答案1+4=5 【C语言进阶】自定义类型详解

🚀运行结果发现正确答案是8：【C语言进阶】自定义类型详解

说明结构体大小并不是各成员数据类型字节之和。
📚结构体大小的计算有着自己的一套规则，那就是结构体对齐规则：
① 第一个成员在与结构体变量偏移量为0的地址处。
②其他成员变量要对齐到某个数字（对齐数）的整数倍的地址处。

对齐数 = 编译器默认的一个对齐数与该成员大小的较小值，即min(默认对齐数，该成员大小)。
VS中默认对齐数为8，Linux没有默认对齐数

③ 结构体总大小为最大对齐数（每个成员变量都有一个对齐数）的整数倍。
④如果嵌套了结构体的情况，嵌套的结构体对齐到自己的最大对齐数的整数倍处，结构体的整体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍。

我们举例子来学习：
1️⃣
在这里插入图片描述

2️⃣
在这里插入图片描述

3️⃣
在这里插入图片描述
4️⃣

❓ 为什么会存在内存对齐？
1.平台原因(移植原因)：不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常。
2. 性能原因：数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于，为了访问未对齐的内存，处理器需要作两次内存访问；而对齐的内存访问仅需要一次访问。
🔱总体来说：结构体的内存对齐就是拿空间换取时间的做法
在这里插入图片描述

❓ 在设计结构体时，如何做到既满足对齐又能节省空间呢？
💯让空间小的成员尽量集中在一起。

struct S1 //12{char c1;int i;char c2;};struct S2 //8{char c1;char c2;int i;     };

虽然S1和S2类型的成员一模一样，但是通过让空间小的成员尽量计中在一起，使所占空间的大小有了一些区别。

7.修改默认对齐数

#pragma 预处理指令，可以改变我们的默认对齐数。

#include #pragma pack(8)//设置默认对齐数为8struct S1{char c1;//1//0int i;//4//4~7char c2;//1//8//0~8等于9,4*2<9  //4*3=12满足};#pragma pack()//取消设置的默认对齐数，还原为默认#pragma pack(2)//设置默认对齐数为2struct S2{char c1;//1//0int i;//4//2~5char c2;//1//6//0~6等于7,4*2=8>7满足};#pragma pack()//取消设置的默认对齐数，还原为默认int main(){//输出的结果是什么？printf("%d\n", sizeof(struct S1));//12printf("%d\n", sizeof(struct S2));//8return 0;}

🚀运行结果：
【C语言进阶】自定义类型详解
🔱结论： 结构在对齐方式不合适的时候，我么可以自己更改默认对齐数。
💊要求： 另外对结构体对齐部分，我们应该熟练到不用画图，直接计算出结构体大小的程度。

8.offsetof宏

头文件：

size_t offsetof(structName, memberName);

structName：结构体类型
memberName：结构体类型的成员指示器
作用：会生成一个类型为 size_t 的整型常量，它是一个结构成员相对于结构开头的字节偏移量。

#include #include struct S{    char c1; //1    //0    int i;//4    //4~7    char c2;//1    //8};int main(){    printf("%d\n", offsetof(struct S, c1));//0    printf("%d\n", offsetof(struct S, i));//4    printf("%d\n", offsetof(struct S, c2));//8    return 0;    }

🚀运行结果：
【C语言进阶】自定义类型详解
💭 百度笔试题： 写一个宏，计算结构体中某变量相对于首地址的偏移，并给出说明。
（注：这里还没学习宏，可以放在宏讲解完后再实现。关注我不迷路~😼）

9.结构体传参

struct S{int data[1000];int num;};struct S s = { {1,2,3,4}, 1000 };//结构体值传参void print1(struct S s){printf("%d\n", s.num);}//结构体址传参void print2(struct S* ps){printf("%d\n", ps->num);}int main(){print1(s);//传结构体print2(&s);//传地址return 0;}

🆚上面的 print1（传结构体）和 print2（传址）函数哪个好些？
💯 答案： 首选print2（传址）函数。
🔑解析：
从时空角度分析：
结构体传值：若该结构体足够大，传值时会拷贝一份一样大的结构体，这时会造成空间和时间上的浪费
结构体传址：无论该结构体多大，传址时用应该结构体指针接收即可。我们知道指针大小是固定的，大小为4/8字节（32位平台为4，64位为8）。

从功能角度分析(这是相对的)：
结构体传值：若我们希望对结构体的内容做修改，则传值就有一定的局限性。
结构体传址：我们可通过结构体地址找到该结构体并对其修改；若不希望修改其内容，我们可以加上const修饰
结论：结构体传参的时候，要传结构体的地址。

10.结构体实现位域（位段）

若程序的结构中包含多个开关量，只有TRUE/FALSE变量，如下：

struct switch{unsigned int a;unsigned int b;}status;

这种结构需要 8 字节的内存空间，但在实际上，存放一个开关量时，只有 0 和1 两种状态，我们只需存储 0 或 1，用一个二进制（比特位）即可。为了节省存储空间，并使处理简便，C语言又提供了一种数据结构，称为“位域”或“位段”。

10.1位域的说明

📚所谓“位域”是把一个字节中的二进位划分为几个不同的区域，并说明每个区域的位数。每个域有一个域名，允许在程序中按域名进行操作。这样就可以把几个不同的对象用一个字节的二进制位域来表示。

10.2位域的定义

位域的定义和结构体是类似的，但有两个不同点：

① 位段的成员只能是： int、unsigned int、signed int
② 位段的成员名后面有一个冒号和一个数字：位域名：位域长度

struct A{    int _a:2;    int _b:5;    int _c:10;    int _d:30;}data;// A就是一个位段类型int main(){    printf("%d\n", sizeof(data));    return 0;}

📣说明： 位域_a占2位，位域_b占5位，位域_c占10位，位域_d占30位，总共47个比特位。
🚀当我们运行后发现结果是8：
【C语言进阶】自定义类型详解
结构体变量data的四个成员占47位，而data的大小是8个字节（64个比特位），为什么会这样呢？这就得深入探究位域的内存分配了。

10.3位域的内存分配

📌 注意事项：
① 位段的成员可以是 int、unsigned int、signed int 或者是 char （属于整形家族）类型。
② 位段的空间上是按照需要以4个字节（ int ）或者1个字节（ char ）的方式来开辟的。
③ 位段涉及很多不确定因素，位段是不跨平台的，注重可移植的程序应该避免使用位段。

❓ 空间是如何开辟的？

struct S{    char a : 3;    char b : 4;    char c : 5;    char d : 4;};int main(){    struct S s = { 0 };    s.a = 10;    s.b = 12;    s.c = 3;    s.d = 4;}

🔑解释说明：
在VS编译器中开辟了空间以后，先使用低地址再使用高地址。并且剩余的比特位不够下一个变量存储时，那这一片空间将会被浪费。
在这里插入图片描述
📚位段的跨平台问题

int 位段被当成有符号数还是无符号数是不确定的。
位段中最大位的数目不能确定。比如16位机器最大16，32位机器最大32，写成27，在16位机器会出问题。
位段中的成员在内存中从左向右分配，还是从右向左分配标准尚未定义。
当一个结构包含两个位段，第二个位段成员比较大，无法容纳于第一个位段剩余的位时，是舍弃剩余的位还是利用，这是不确定的。

🔱总结： 跟结构相比，位段可以达到同样的效果，但是可以很好的节省空间，但是有跨平台的问题存在。

⚡位域的应用：
在这里插入图片描述
🔑解释说明：
上图是网络上IP数据包的格式，当你想要在网络上发一条消息给你的好友，信息是需要进行分装的，消息作为数据只是传输的一部分，还有一部分传输的是分装中的其他信息。比如4位版本号，4位首部长度，这些信息只需要4个bit，如若不使用位段，直接每个部分一个整形的给空间，就会造成空间的大量浪费。

二、枚举

枚举顾名思义就是一一列举，把可能的取值一一列举。
比如性别有男、女和保密，可以一一列举；葫芦娃有7个，可以一一列举。
【C语言进阶】自定义类型详解

1.枚举的定义

枚举的定义：
在这里插入图片描述

💬举例：

enum Day //星期{Mon,Tues,Wed,Thur,Fri,Sat,Sun//横着放也可以};

enum Day是枚举类型，{ }里的内容是枚举类型的可能取值，即枚举常量。
这些可能取值都是有值的，默认从0开始，一次递增1，当然在定义的时候也可以赋初值。例如：

enum Color //颜色{    // 枚举常量    RED = 1, // 赋初值    GREEN = 2,    BLUE = 4};

2.枚举的优点

❓ 我们可以用 #define 定义常量，为什么非要使用枚举？
📚 枚举的优点：

增加代码的可读性和可维护性
和#define定义的标识符比较枚举有类型检查，更加严谨。
防止了命名污染（封装）
便于调试
使用方便，一次可以定义多个常量

3.枚举的使用

#include <stdio.h>enum Color //颜色{    RED = 1,    GREEN = 2,    BLUE = 4};int main(){   enum Color c = GREEN;   c = 5;   printf("%d\n", c);//5   return 0;}

📌注意事项：
①默认从0开始，依次递增1（若对一个枚举常量赋初值，其后的枚举常量默认依次+1（当不对其赋值））
②枚举常量不能改变（在类型创建时的{}内可改变，出了{}不能改变），但由枚举类型创建出来的变量是可以改变的（细品）

enum Color //颜色{   //①    RED,//0    GREEN = 2,    BLUE//3};int main(){   //②    enum Color c = RED;    c = 2;//2是整型，整型赋值给枚举类型（类型不匹配），在.c文件下不会报错，在.cpp文件下则会报错    c = BLUE;//✅枚举类型创建的变量可以改变    //BLUE = 4;❌  //枚举常量不能改变}

🆚对比下图左右两份代码，哪一份更好？
在这里插入图片描述
左边： 如果不查看menu，根本不知道case后的01234代表什么
右边： 使用了枚举，提高了代码的可读性，当看到EXIT就知道是退出程序…

三、联合体（共用体）

1.联合体简介

📚联合体是一种特殊的自定义类型，这种类型定义的变量也包含一系列的成员，特征是这些成员公用同一块空间（所以联合体也叫共用体）。

2.联合体的声明和定义

在这里插入图片描述
💬具体代码：

#include <stdio.h>union Un{    char c;//1    int i;//4};int main(){    union Un u;//创建一个联合体变量    printf("%d\n", sizeof(u));//4    return 0;}

🚀运行结果是4：
【C语言进阶】自定义类型详解
❓ 为什么是4个字节呢？我们来深入探究下：

#include union Un{    char c;//1    int i;//4};int main(){    union Un u;    printf("%p\n", &u);    printf("%p\n", &(u.c));    printf("%p\n", &(u.i));    return 0;}

🚀运行结果：
【C语言进阶】自定义类型详解
🔑解析：
在这里插入图片描述
🔱结论： 联合体的成员是共用同一块内存空间的。因为联合至少要有保存最大成员的能力，所以一个联合变量的大小至少是最大成员的大小。

3.联合体的初始化

💬代码演示：

#include union Un{    char c;//1    int i;//4};int main(){    union Un u = {10};    return 0;}

🩺调试中的监视：
【C语言进阶】自定义类型详解
发现c和i的值都是10，说明c和i是公用同一块内存空间的。

所以我们可以猜想：当给联合体变量 u 中的 i 赋予一个值，再给 c 赋予一个值，i 会发生改变。我们可以验证：
在这里插入图片描述
i 的值果然被改变了。因为给 i 赋值为1000，会在公用的4字节空间，存入1000的二进制数；当再给 c 赋值为100，会将 c 那1字节的空间，存入100的二进制数，从而改变了 i 。
🔱结论： 在同一时间内你只可以使用联合体中的一个成员。

4.联合体大小的计算

💬代码：

#include union Un{    char a[5];//5    int i;//4};int main(){    union Un u;    printf("%d\n", sizeof(u));    return 0;}

🚀运行结果：
【C语言进阶】自定义类型详解
按照上面的分析应该是5呀，为什么是8呢？

其实联合体也是存在对齐的，现在我们深入探究联合体的大小规则：
📚 联合体大小的计算：

① 联合的大小至少是最大成员的大小，但不一定是最大成员的大小。
② 当联合体的大小不是最大对齐数的整数倍时，就要对齐到最大对齐数的整数倍。（或者说是联合体大小要是所有成员变量类型大小（类型最大值）的整数倍。）

因此：
在这里插入图片描述

5.联合体应用

💬一道面试题：
判断当前机器大小端

大小端仙人指路：C语言进阶系列之数据存储
之前的方法： 将int*的地址强转为char*，达到访问一个字节的目的。

#includeint check_sys(){int a = 1;   //0x00 00 00 01return (*(char*)&a);//返回0,大端;返回1,小端}int main(){int ret = check_sys();if(0 == ret)printf("大端\n");else if(1 == ret)printf("小端\n");return 0;}

现在，我们通过联合体的方式判断（利用了联合体特点）：

#include int check_sys(){    union U    { char c; int i;    } u;    u.i = 1;    return u.c;// 返回1,就是小端;返回0,就是大端}int main(){    int ret = check_sys();    if (0 == ret) printf("大端\n");    else if(1 == ret) printf("小端\n");    return 0;}

🚀运行结果：
【C语言进阶】自定义类型详解

写文和制图不易，恳请各位铁汁们点赞收藏评论加关注，你们的支持是我坚持的动力~
在这里插入图片描述
……未完待续

✒️ 笔者：陈汉新

📅 更新： 2022.3.28

❌ 勘误：暂无

📣 声明：由于作者水平有限，本文错误之处在所难免，敬请读者指正！

【C语言进阶】自定义类型详解

文章目录

前言

一、结构体

1.结构的基础知识

2.结构体的声明

3.匿名结构体

4.结构体的自引用

5.结构体变量的定义和初始化

6.结构体内存对齐

7.修改默认对齐数

8.offsetof宏

9.结构体传参

10.结构体实现位域（位段）

10.1位域的说明

10.2位域的定义

10.3位域的内存分配

二、枚举

1.枚举的定义

2.枚举的优点

3.枚举的使用

三、联合体（共用体）

1.联合体简介

2.联合体的声明和定义

3.联合体的初始化

4.联合体大小的计算

5.联合体应用

公告

DeepSeek全套部署资料免费下载

免费可商用字体批量下载

标签

【C语言进阶】自定义类型详解

文章目录

前言

一、结构体

1.结构的基础知识

2.结构体的声明

3.匿名结构体

4.结构体的自引用

5.结构体变量的定义和初始化

6.结构体内存对齐

7.修改默认对齐数

8.offsetof宏

9.结构体传参

10.结构体实现位域（位段）

10.1位域的说明

10.2位域的定义

10.3位域的内存分配

二、枚举

1.枚举的定义

2.枚举的优点

3.枚举的使用

三、联合体（共用体）

1.联合体简介

2.联合体的声明和定义

3.联合体的初始化

4.联合体大小的计算

5.联合体应用

相关问题

公告

DeepSeek全套部署资料免费下载

免费可商用字体批量下载

标签