当前位置: 首页 > news >正文

【Linux我做主】探秘gcc/g++和动静态库

@TOC

Linux编译器gcc/g++的使用

github地址

有梦想的电信狗

前言

在软件开发的世界中,编译器如同匠人的工具,将人类可读的代码转化为机器执行的指令。

对于Linux开发者而言,gccg++是构建C/C++程序的核心工具链,掌握它们的原理和使用技巧是每一位开发者成长的必经之路。

本文将深入剖析从源代码到可执行程序的完整生命周期,揭示预处理、编译、汇编、链接四大阶段的神秘面纱,探讨动静态库的本质差异,解密DebugRelease版本背后的工程权衡。

无论您是初探Linux开发的爱好者,还是希望夯实编译原理的进阶者,本文都将为您呈现一场理论与实践并重的技术之旅。


C/C++可执行程序的形成过程

C/C++源文件.c或.cpp源文件形成可执行程序需要经历预处理、编译、汇编、链接四个过程,接下来依次介绍各个时期的特点以及Linux下的编译器gcc/g++是如何实现这些过程的。

预处理 (Preprocessing)

​输入文件​: .c/.cpp 源文件
​输出文件​: .i 文件(预处理后的文本文件,预处理后依然是.c/.cpp 文件)
​工具​: 预处理器

核心过程:

  1. 展开所有 #include 指令,递归插入头文件内容
  2. 处理 #define 宏定义,执行文本替换。
  3. 条件编译处理(#ifdef, #ifndef, #endif 等)
  4. 删除所有注释(///* */),删除所有空行和空白。
  5. 添加行标记(#line 指令)供调试使用
  6. 处理 #pragma 编译器指令
  • 使用gcc编译器仅完成预处理步骤
    示例:gcc -E main.c -o main.i

编译 (Compilation)

​输入文件​: .i 文件
​输出文件​: .s 文件(汇编代码文件)
​工具​: 编译器(如 gcc, clang

  • 编译是消耗时间和资源最多的步骤。

核心过程:

  1. ​词法分析​​:将源代码分解为 Token 流,检查语法
  2. ​语法分析​​:构建抽象语法树(AST)
  3. ​语义分析​​:类型检查、作用域验证等
  4. ​中间代码生成​​:生成平台无关的中间表示(如 LLVM IR)
  5. ​代码优化​​:进行死代码消除、循环优化等
  6. ​目标代码生成​​:生成特定 CPU 架构的汇编代码

了解了以上过程,我们认识到,**宏不会进行类型检查和语法分析**的原因是:

  • 宏进行的是文本替换,在预处理阶段进行

  • 语法检查是在编译阶段进行的。

    因此常说宏是类型不安全的

    将预处理后的文件翻译成汇编语言指令:

    示例:gcc -S main.i -o main.s


汇编 (Assembly)

  • 将汇编指令翻译成机器指令的过程。

    ​输入文件​: .s 文件
    ​输出文件​: .o/.obj 文件(二进制目标文件)
    ​工具​: 汇编器

核心过程:

  1. 将助记符形式的汇编代码转换为机器指令(二进制操作码)
  2. 生成符号表(记录函数/变量地址信息)
  3. 生成重定位表(标记需要链接时修正的地址)
  4. 生成节区信息(text/data/bss 等段)

可执行文件的格式:

  • Linux: ELF 格式(Executable and Linkable Format)
  • Windows: COFF 格式(Common Object File Format)

示例:gcc -c main.s -o main.o


链接 (Linking)

​输入文件​: .o 文件 + 静态库或动态库(.a/.lib
​输出文件​: 可执行文件(.exe(windows下) 或有执行权限的文件(Linux下))
​工具​: 链接器

核心过程:

  1. ​符号解析​​:匹配所有未定义符号与其定义
  2. ​地址分配​​:
    • 地址回填:给每个目标文件分配运行时内存地址
    • 数据段合并:合并相同类型的节区(如多个.text段合并)
  3. ​重定位修正​​:根据实际地址修改代码中的引用
  4. ​解析库依赖​​:
    • 静态链接:直接将库代码复制到可执行文件中
    • 动态链接:生成导入表记录共享库信息

链接类型:

类型特点文件扩展名
静态链接代码体积大,无运行时依赖.a (Linux) .lib (Windows)
动态链接代码体积小,需要运行时环境支持.so (Linux) .dll (Windows)

示例:gcc main.o -o main

在进行多文件编译时,对每个文件进行单独编译,最终一起链接。


完整流程示例

# 完整编译流程(隐含执行所有阶段)
gcc main.c -o main# 分步执行(显式控制每个阶段)
gcc -E main.c -o main.i    # 预处理
gcc -S main.i -o main.s    # 编译
gcc -c main.s -o main.o    # 汇编
gcc main.o -o main         # 链接

gcc/g++如何完成可执行程序的形成过程

形成过程

例如有源文件main.c,现要分步骤对其进行编译形成可执行文件。

  • 预处理

    • gcc -E main.c -o main.i该指令告诉gcc,现在开始进行程序的翻译,预处理结束后停止。
  • 编译

    • gcc -S main.i -o main.s该指令告诉gcc,对预处理过后的.i文件进行处理,编译结束后停止。
  • 汇编

    • gcc -c main.s -o main.o该指令告诉gcc,汇编结束后停止。
    • 形成的.o文件是可重定位目标二进制文件,简称目标文件。windows下是.obj文件,不可以独立执行,虽然已经是二进制格式了,但需要链接后才可以执行。
      在这里插入图片描述
  • 链接

    • gcc main.o -o main 将可重定位目标二进制文件,和库链接形成可执行程序。

最常用的命令行编译指令

我们在进行单个源文件的编译时,如果没有查看中间文件的需求,则直接使用gcc一步完成编译

gcc test.c  #默认生成的程序名为a.out
gcc test.c -o test   # 指定可执行程序的名字为 test

在这里插入图片描述

选项记忆小妙招

预处理、编译、汇编三个过程的选项分别是-E -S -c

  • 刚好组成ESc

预处理、编译、汇编三个过程形成的文件的后缀依次是.i .s .o

  • 三个字母组成iso,恰好是操作系统的镜像文件的后缀名。

gcc编译的其他常用选项

  • -E: 只激活预处理,这个不生成文件,你需要把它重定向到一个输出文件里面。
  • -S: 编译到汇编语言,不进行汇编和链接
  • -c 编译到目标代码
  • -o 文件输出到文件
  • -static 此选项对生成的文件采用静态链接。gcc编译在链接库时默认采用动态链接。
  • -g 生成调试信息。GNU 调试器可利用该信息。
  • -shared 此选项将尽量使用动态库,所以生成文件比较小,但是需要系统有动态库.
  • -O0-O1-O2-O3 编译器的优化选项的4个级别,-O0表示没有优化,-O1为缺省值,-O3优化级别最高
  • -w 不生成任何警告信息。
  • -Wall 生成所有警告信息。

g++相关

对于以上操作和选项,gcc所有的编译操作和命令选项同样适用于g++,只不过编译的源程序变成了.cpp文件。

g++和gcc的区别

编译器主要语言支持次要语言支持
gccC语言C++(需显式指定)
g++C++(ISO标准)C(不推荐)

关键区别

  • gcc默认作为C语言编译器
  • g++默认作为C++编译器,g++既可编译C语言,也可以编译C++
预定义宏差异
编译器默认宏
gcc__STDC__
g++__cplusplus

示例检测:

#ifdef __cpluspluscout << "C++环境";  // g++会执行
#elseprintf("C环境");    // gcc可能执行
#endif
使用场景指南

推荐使用g++的情况

  • 纯C++项目开发
  • 使用STL/模板等C++特性
  • 需要异常处理/RTTI特性
  • 混合C/C++代码(作为主要编译器)

推荐使用gcc的情况

  • 纯C语言项目开发
  • 需要严格C标准兼容
  • 嵌入式开发(配合-ffreestanding
  • 内核开发等底层编程
对比总结表
特性gccg++
默认标准C17C++17
标准库链接需手动-lstdc++自动链接
文件后缀处理根据后缀判断强制C++模式
函数重载不支持支持
异常处理默认禁用默认启用
RTTI需手动开启默认启用
启动代码C启动程序C++启动程序
预定义宏STDC__cplusplus

链接与库:初始动静态库

上文在介绍链接过程时,提到了​​输入文件​.o 与静态库或动态库(.a/.lib)的链接共同形成可执行文件,那么什么是库呢?

  • 同时思考

我们的C程序中,并没有定义printf的函数实现,且在预编译中包含的头文件<stdio.h>中也只有该函数的声明,而没有定义函数的实现,那么,是在哪里实现printf函数的呢?

最后的答案是:系统把这些函数实现都被做到名为 libc.so.6 的库文件中去了,在没有特别指定时,gcc会到系统默认的搜索路径/usr/include下进行查找,也就是链接到 libc.so.6 库函数中去,这样就能实现函数printf了,而这也就是链接的作用

什么是库?

库(Library)是预编译的二进制代码集合,包含可重用的函数/类/资源。在链接过程中,编译器会将.o目标文件与静态库(.a/.lib)或动态库(.so/.dll)链接,最终生成可执行文件。

库分为动态库和静态库。

  • Linux下的头文件和库默认搜索路径在/usr/include目录下
    在这里插入图片描述

动态库

  • 概念
    动态库Dynamic Library)是一种在程序​​运行时​​被动态加载到内存的二进制代码库,其核心设计目标是实现代码的​​共享复用​​和​​资源优化​​。

动态库的代码不会在编译时直接嵌入可执行文件,而是由操作系统的动态链接器(如ld-linux.so)在程序启动时或运行期间(通过dlopen())按需加载到内存。

  • 特点
    • 文件扩展名:Linux下为.so(Shared Object),Windows为.dll
    • 运行时加载:程序运行时由动态链接器加载到内存
    • 共享性:多个程序可共享同一份动态库实例
    • 版本控制:通过符号版本机制支持ABI兼容更新

静态库

  • 概念
    静态库是指编译链接时,把库文件的代码全部加入到可执行文件中,因此生成的文件比较大,但在运行时也就不再需要库文件了。其后缀名一般为.a
  • 特点
    • 文件扩展名:Linux下为.a(Archive),Windows为.lib
    • 编译时链接:库代码直接嵌入到最终可执行文件中
    • 独立性:不依赖外部库文件即可运行
    • 体积代价:导致可执行文件体积显著增大

  • 库存在的意义
  1. 代码复用:避免重复造轮子
  2. 模块化开发:解耦复杂系统
  3. 知识产权保护:分发二进制而非源码
  4. 降低维护成本:更新库文件无需重新编译主程序
  5. 节省存储空间:动态库可被多个进程共享
  6. **关于学习和工作:**在学习阶段,我们是适度的造轮子;而在工作阶段,我们最好找已有的解决方案。

gcc的默认链接方式及file和ldd命令

  • Linux中,gcc编译形成可执行程序,默认采用的是动态链接,需要系统提供动态库。
  • Linux中,如果想以静态链接的方式形成可执行程序,需要在编译时添加-static选项,并且系统需要提供静态库。

在这里插入图片描述

  • test_dygcc默认的编译程序,默认采用动态链接。

  • test_staticgcc指定静态链接时的编译程序,可以明显的看到程序的体积大了很多。

  • 我们可以通过file命令来查看可执行程序的链接方式。
    在这里插入图片描述

  • 可以使用ldd命令查看可执行程序已链接的动态库
    在这里插入图片描述
    可以看到:

  • 动态链接形成的test_dy链接了一些动态库

  • 静态链接形成的test_static没有已链接的动态库

动静态库优缺点对比

特性静态库动态库
文件体积显著增大较小
内存占用独立占用共享内存
部署复杂度简单(单文件)需确保库文件存在
更新维护需重新编译替换库文件即可
启动速度较快(无加载开销)略慢(需要加载)
适用场景嵌入式、独立工具大型应用、系统级服务
  • 动态库因为是共享库,可以有效的节省资源,包括(磁盘空间、内存空间、网络空间等)。动态库一旦缺失,会导致各个程序都无法运行。
  • 静态库,不依赖库,程序可以独立运行。但体积大,消耗资源。

总结

  • 动态链接的库,就叫动态库,静态链接的库,就叫静态库。
  1. 如果我们没有静态库,但要在编译时使用-static选项,这是不可行的。
  2. 如果我们没有动态库,只有静态库,且能静态库被编译器找到,则可以正常链接。
  3. -static选项的本质是改变编译器链接模式的优先级。-static只适配一次,会将所有的链接要求全部变成静态链接。
  4. 在一个程序中,既会有动态库,也会有静态库,一般都是动静态库混合使用的。

CentOS下安装静态库

一般的Linux系统,默认只提供了动态库,静态库库需要我们自行进行安装。

C语言静态库

sudo yum install glibc-static

C++静态库

sudo yum install libstdc++-static

验证安装

# 查找静态库路径
sudo find /usr/ -name "libc.a"
sudo find /usr/ -name "libstdc++.a"
  • 查找结果如下
    在这里插入图片描述

开发建议

  1. 优先使用动态库:适用于大多数桌面/服务器应用
  2. 谨慎选择静态库:考虑磁盘空间和内存限制
  3. 混合使用策略:关键模块静态链接,通用功能动态链接
  4. ABI兼容性:动态库更新时保持向后兼容

Debug与Release软件简介

gcc编译器在不增加特殊选项时,默认采用release版本编译形成可执行程序

核心概念

Debug版本

  • 编译特性:包含调试符号(-g)可以被追踪调试、禁用优化(-O0)
  • 文件体积:可执行文件略大(形成可执行文件时,添加了调试信息)
  • 典型用途
    • 开发阶段调试
    • 崩溃问题分析
    • 性能问题定位

Release版本

  • 编译特性:启用优化(-O2/-O3)、去除调试符号
  • 文件体积:可执行文件较小
  • 典型用途
    • 生产环境部署
    • 性能敏感场景
    • 正式版本发布
  • debug版本软件包含了调试信息,因此软件的体积更大一些
    在这里插入图片描述
  • gcc编译器在不增加特殊选项时,默认采用release版本编译形成可执行程序
  • 我们在编译时添加-g选项,可形成包含调试信息的可执行程序
  • 那么选项-DDEBUG又有什么含义呢?

场景引入:

在这里插入图片描述

两个命令-g-DDEBUG两个选项生成的程序虽然都用于调试,但包含的信息不同,具体区别如下:

  1. gcc test.c -o test_Debug -DDEBUG
    -DDEBUG:定义预处理宏DEBUG,用于在编译时启用代码中#ifdef DEBUG控制的调试逻辑(如打印日志、额外检查等)。
    不包含调试符号:生成的程序没有嵌入调试信息(如变量名、行号),无法直接通过调试器(如GDB)进行源码级调试。
    程序行为可能不同:如果代码依赖DEBUG宏控制逻辑,test_DEBUG会执行这些调试相关的代码。
    • -DDEBUG选项的本质是在源程序文件中添加了DEBUG宏,用于在编译时启用代码中#ifdef DEBUG控制的调试逻辑。
  2. gcc test.c -o test_debug -g
    -g:嵌入调试符号,允许使用调试器跟踪变量、设置断点等。
    不启用DEBUG:除非代码中已定义或通过其他方式启用,否则#ifdef DEBUG的代码不会编译到程序中。
    程序行为与未启用DEBUG宏的版本一致(假设代码逻辑依赖该宏)。
关键区别:
选项调试符号(-g启用DEBUG宏(-DDEBUG
test_Debug❌ 无✔️ 启用
test_debug✔️ 有❌ 未启用(除非代码已定义)
结论:

是否属于“Debug模式”:取决于定义。若认为需同时包含调试符号和调试代码,则两者均不完全;若接受部分特性,则分别属于不同维度的调试版本。
信息差异:两者包含的信息不同test_Debug可能包含更多调试输出但难以用调试器分析;test_debug便于调试但可能缺少DEBUG宏控制的代码。


Debug和Release核心差异对比

特性Debug版本Release版本
编译选项-g -O0-O2/-O3
符号表包含完整调试信息通常去除
代码优化无优化(保留原始逻辑)高度优化(可能改变执行流)
执行速度较慢快(提升20%-300%)
内存占用较高较低
逆向难度容易(保留符号)困难

readelf命令查看调试信息

在这里插入图片描述

高级控制技巧

条件编译宏

#ifdef NDEBUG
// Release模式专用代码
#else
// Debug模式专用代码
#endif

总结

通过本文的探索,我们揭开了gcc/g++编译器从源代码到二进制程序的全流程面纱。从预处理阶段的宏展开到编译阶段的语法树构建,从汇编指令的生成到链接时的符号解析,每一个环节都彰显着计算机科学的精妙设计。

理解动静态库的取舍之道,掌握Debug版本的调试信息嵌入,这些知识不仅让我们在日常开发中游刃有余,更赋予了我们优化程序性能、诊断疑难问题的关键能力。


以上就是本文的所有内容了,如果觉得文章写的不错,还请留下免费的赞和收藏,也欢迎各位大佬在评论区交流

分享到此结束啦
一键三连,好运连连!

相关文章:

  • RestControllerAdvice 和 ControllerAdvice 两个注解的区别与联系
  • 二十、FTP云盘
  • Operator 开发入门系列(一):Hello World
  • 【Java学习笔记】标识符和保留字
  • NLP高频面试题(四十七)——探讨Transformer中的注意力机制:MHA、MQA与GQA
  • 火山云如何运营
  • Vscode开发Vue项目NodeJs启动报错处理
  • 【Rust基础】crossbeam带来的阻塞问题
  • 大模型-mcp学习
  • 基于Django实现的图书分析大屏系统项目
  • 为什么要做种草商城
  • MAPLE:编码从自我为中心的视频中学习的灵巧机器人操作先验
  • LeetCode之两数之和
  • 驱动-原子操作
  • 《Java 泛型的作用与常见用法详解》
  • 【JavaScript】二十四、JS的执行机制事件循环 + location + navigator + history
  • 做Data+AI的长期主义者,加速全球化战略布局
  • 4月17日复盘
  • Kettle和Canal
  • 【AI论文】Genius:一种用于高级推理的可泛化和纯无监督的自我训练框架
  • 上海:以税务支持鼓励探索更多的创新,助力企业出海
  • 外交部:中美双方并未就关税问题进行磋商或谈判
  • 成都警方:在地铁公共区域用改装设备偷拍女乘客,男子被行拘
  • “杭州六小龙”的招聘迷局
  • 赛力斯拟赴港上市:去年扭亏为盈净利59亿元,三年内实现百万销量目标
  • 上海灵活就业人员公积金新政有哪些“创新点”?