专栏:C语言
个人主页:HaiFan.
专栏简介:本专栏主要更新一些C语言的基础知识,也会实现一些小游戏和通讯录,学时管理系统之类的,有兴趣的朋友可以关注一下。
结构体
前言一、结构体1.结构体类型的声明2.结构体的自引用3.结构体变量的定义和初始化4.结构体内存对齐3.1修改默认对齐数 5.结构体传参 二、位段1.什么是位段2.位段的内存分配3.位段的跨平台问题 三、枚举1.枚举类型的定义2.枚举的优点 四、联合(共用体)1.联合类型的定义2.联合的特点3.联合体大小的计算前言
一、结构体
1.结构体类型的声明
结构体是什么?结构体就是一些值的集合,这些值称为成员变量,结构的每个成员可以是不同类型的变量。
struct tag//结构体的名字{member-list;//这是结构体的成员}variable-list;//这就是结构体的声明
如描述运动和人数
struct sport{int run;//跑步int soccer;//足球int badminton;//羽毛球char name[100];//姓名};//分号不能丢
这里的run,soccer,badminton,name,都是成员变量
。
结构体中,有一个特殊的声明,就是在声明结构的时候,可以不完全声明。
如:
//匿名结构体类型struct{int a;char b;float c;}x;
上面的结构体在声明的时候,省略了结构体的标签(tag),这种结构体被称为匿名结构体。
2.结构体的自引用
在一个结构体中包含一个类型为该结构本身的成员是否可以呢?
struct Node{int data;struct Node next;};
这样做,可行吗?
很显然不可行。那么正确的用法是是什么呢?
struct Node{int data;struct Node* next;};
在自引用中,若使用结构本身的成员,每次在调用结构体的时候,会发生嵌套,所以应该使用指针类型。指针就是地址,不会发生嵌套。
typedef struct{int data;Node* next;}Node;typedef struct Node{int data;struct Node* next;}Node;
这两个代码,哪一个是合法的呢?答案是第二个,因为第一个结构体成员是Node* next;
在调用该next成员的时候,typedef还没有起到作用。
3.结构体变量的定义和初始化
有了结构体的成员,该如何定义变量?其实很简单。
struct Point{int x;int y;}p1; //声明类型的同时定义变量p1struct Point p2; //定义结构体变量p2
这是定义结构体的两种方式。
结构体的初始化
struct Stu //类型声明{char name[15];//名字int age; //年龄};struct Stu s = {"zhangsan", 20};//初始化
这就是结构体的初始化。
struct Stu s;scanf("%s %d",s.name, &s.age);
也可以通过自己输入,进行初始化。
4.结构体内存对齐
前面已经介绍了结构体的基本使用,那么如何计算结构体的大小呢?我们知道int4字节,char1字节,double8字节
,
struct Stu {char name[10];int age; double len;float w;long a;long long c;};
我们知道不同的数据类型占多少字节,那么这个结构体的大小是10+4+8+4+4+8=38吗?
很奇怪,结果并不是所有成员所占的字节数相加。下面为大家介绍:结构体的内存对齐,这是一个特别热门的考点。
结构体大小如何计算?
首先得掌握结构体的对齐规则:
第一个成员在与结构体变量偏移量为0的地址处。其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。 对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值。 VS中默认的值为8结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整 体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
struct S1{char c1;int i;char c2;};printf("%d\n", sizeof(struct S1));
char占1个字节,int占4个字节,根据规则1,要先从偏移量为0的地址处开始。再根据规则2,找到int的倍数的位置开始对齐,然后在找最后一个c2的位置,除了0,其他数都是1的倍数,所以c2对齐到8的位置即可,现在结构体的大小为9,再根据规则3,结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍,所以要继续扩大,直到找到所有成员中最大对齐数的整数倍为止,也就是12.
struct S2{double d;char c;int i;};printf("%d\n", sizeof(struct S2));
这个结构体的大小是多少?
首先,double占8个字节,从0的位置开始对齐,后面的char占1个字节,对齐到double后面的位置即可,然后就是int占4个字节,先找到4的倍数的位置,开始对齐,然后看此时的大小是不是结构体成员中对齐数最大的数的倍数,如果是,则此时的大小就是结构体的大小,若不是,则继续对齐,直到找到结构体成员中对齐数最大的数的倍数为止。
此时算出来的大小为16,16是double 8的倍数,所以16就是该结构体的大小。
struct S2{double d;char c;int i;};printf("%d\n", sizeof(struct S2));//16struct S3{char c1;struct S2 s2;double d;};printf("%d\n", sizeof(struct S3));
那么嵌套的结构体的大小是多少呢?
还是老规矩,先把c1对齐到0的位置处,然后根据规则4,先找到s2结构体里的最大对齐数,在找到该数的倍数处,开始对齐,注:这里就不是在对齐8个,而是对齐s2结构体的大小16个
,之后在对齐最后一个double d。
此时结构体的大小是31,但是并不满足规则3,继续对齐,最后结构体的大小就是32.
为什么存在内存对齐?
大部分的参考资料都是如是说的:
1.平台原因(移植原因): 不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特 定类型的数据,否则抛出硬件异常。
2.性能原因: 数据结构(尤其是栈)应该尽可能地在自然边界上对齐。性能原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访 问。
总体来说:
结构体的内存对齐是拿空间来换取时间的做法。
那在设计结构体的时候,我们既要满足对齐,又要节省空间,如何做到:
让占用空间小的成员尽量集中在一起。
3.1修改默认对齐数
之前我们见过#pragma
这个预处理命令,这里我们再次使用就可以改变我们的默认对其数。
#include <stdio.h>#pragma pack(8)//设置默认对齐数为8struct S1{char c1;int i;char c2;};#pragma pack()//取消设置的默认对齐数,还原为默认#pragma pack(1)//设置默认对齐数为1struct S2{char c1;int i;char c2;};#pragma pack()//取消设置的默认对齐数,还原为默认int main(){//输出的结果是什么?printf("%d\n", sizeof(struct S1));printf("%d\n", sizeof(struct S2));}
结论: 结构在对齐方式不合适的时候,我么可以自己更改默认对齐数。
5.结构体传参
直接看代码:
struct S{int data[1000];int num;};struct S s = {{1,2,3,4}, 1000};//结构体传参void print1(struct S s){printf("%d\n", s.num);}//结构体地址传参void print2(struct S* ps){printf("%d\n", ps->num);}int main(){print1(s); //传结构体print2(&s); //传地址return 0;}
上面的print1和print2哪一个更好?
答案是:print2.
原因:
函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降。
结论: 结构体传参的时候,要传结构体的地址。
二、位段
1.什么是位段
位段的声明和结构是类似的,但有两个不同。
1.位段的成员必须是int,unsigned in,或者signed int。
2.位段成员名后边跟一个冒号和一个数字。
struct stu{int _people : 2;int _run : 5;int _go : 10;};
stu就是一个位段类型。
那么位段stu的大小是多少呢?
printf("%d", sizeof(struct stu));
答案是4,为什么会是4呢?
int占4字节,32个bit位,而位段里面的2,5,10,表示的是占多少bit位,成员一占2个bit位,成员而占5个bit位,成员3占10个bit位,总共占17个bit位,没有超过int的大小,所以是四个字节。
struct stu{int _people : 2;int _run : 5;int _go : 10;int _a : 30;};
那么这个printf("%d", sizeof(struct stu));
是多少呢?
按照前面的分析方法,前三个成员总共占17个bit位,第四个成员占30个bit位,一个int是不够存放的,所以要在开辟一个空间,存放第四个成员,所以得到的结果是8.
2.位段的内存分配
位段的成员可以是 int unsigned int signed int 或者是 char (属于整形家族)类型位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段struct S{char a:3;char b:4;char c:5;char d:4;};struct S s = {0};s.a = 10;s.b = 12;s.c = 3;s.d = 4;
那么这些数值是如何在位段中进行内存分配的呢?
一共是8个字节。
先把10的补码写出来,00001010,因为a只要3个bit位,所以就发生了神奇的现象——截断,所谓截断,就是只把前三个bit位拿出,后面的全部不要。就得到了
在把12的补码写出来,00001100,在发生截断,只要前4个bit位,
在把3的补码写出,00000011,截断,只要前5个bit位,因为一个char已经无法满足继续存c截断之后的补码了,所以要开辟一个新空间来存放c。
同样,再按照相同的规则存放d,即可。int类型也是这样。
3.位段的跨平台问题
int 位段被当成有符号数还是无符号数是不确定的。位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题。位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是
舍弃剩余的位还是利用,这是不确定的。
总结: 跟结构相比,位段可以达到同样的效果,但是可以很好的节省空间,但是有跨平台的问题存在。
三、枚举
什么是枚举,枚举就是遍历 ,比如一到十 一 一 列举出来。
只要是可以 一 一 列举出来的,都可以使用枚举。
1.枚举类型的定义
enum Sex{man,woman};
这就是枚举类型,{}中的内容是枚举的可能取值,也叫做枚举常量。
注:用逗号隔开,最后一个枚举常量后面没有符号
当然,这些取值都是有值的。
默认从0开始,每次都会递增1,当然在定义的时候也可以赋值。
enum Sex{man = 1,woman = 4};
2.枚举的优点
我们可以使用 #define 定义常量,为什么非要使用枚举?
枚举的优点:
增加代码的可读性和可维护性和#define定义的标识符比较枚举有类型检查,更加严谨。防止了命名污染(封装)便于调试使用方便,一次可以定义多个常量
后面我会用枚举和动态内存来优化通讯录。
四、联合(共用体)
1.联合类型的定义
联合也是一种特殊的自定义类型
这种类型定义的变量也包含一系列的成员,特征是这些成员共用同一块空间。
union u{int a;char b;};int main(){union u de;printf("%d", sizeof(de));return 0;}
由此可见,a和b共用同一块空间。空间是数据类型最大的那一个。
2.联合的特点
联合的成员是共用同一块内存空间的,这样一个联合变量的大小,至少是最大成员的大小(因为联合至少得有能力保存最大的那个成员)。
3.联合体大小的计算
联合的大小至少是最大成员的大小。当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。union Un1{char c[5];int i;};int main(){printf("%d\n", sizeof(union Un1));return 0;}
最大成员的大小是c,占5个字节,这里面的最大对齐数是4字节,因为5不是4的倍数,所以要进行对齐,直到找到最大对齐数的整数倍的位置即可,也就是8.