悠悠楠杉
含大量图文解析及例程|Linux下的ELF文件、链接、加载与库(中)
标题:动态链接的艺术:ELF文件如何实现运行时拼图
关键词:ELF, 动态链接, GOT, PLT, 地址无关代码
描述:深入解析ELF文件的动态链接机制,通过地址无关代码、全局偏移表与过程链接表实现共享库的魔法加载。
正文:
在Linux系统中,超过80%的可执行文件依赖动态链接。当你在终端输入./app时,操作系统如何将碎片化的代码片段组装成完整的程序?这一切的核心秘密藏在ELF文件的动态节区中。
一、地址无关代码(PIC)的诞生
静态链接的致命缺陷在于绝对地址硬编码。观察以下非PIC代码:
c
// nonpic.c
extern int globalvar;
int foo() {
return globalvar + 1;
}编译后的汇编呈现绝对地址引用:nasm
movl globalvar(%rip), %eax # 假设global_var地址0x6000d0
当多个进程加载同一库时,若地址冲突则需整个库重定位——这正是PIC要解决的痛点。
二、GOT:全局偏移表的精妙设计
PIC代码通过全局偏移表(GOT) 间接访问全局变量。改造后的代码:
c
// pic.c
extern int global_var;
int foo() {
extern int *global_var_ptr;
return *global_var_ptr + 1;
}
对应的GOT表示例:
| 偏移地址 | 指向目标 |
|----------|-----------------|
| 0x2000 | &global_var (运行时填充) |
| 0x2008 | &malloc |
通过objdump -d查看实际指令:nasm
movq global_var@GOTPCREL(%rip), %rax # 获取GOT条目地址
movl (%rax), %eax # 解引用获取真实值
三、PLT:延迟绑定的关键桥梁
函数调用通过过程链接表(PLT) 实现延迟绑定。观察调用printf的跳转逻辑:
nasm
section .plt
printf@plt:
jmp *GOT[3] # 首次跳转到GOT中绑定的下条指令地址
pushq index # 将重定位索引压栈
jmp .PLT0 # 进入动态链接器
section .got
GOT[3]: .quad .plt+6 # 初始指向PLT内部的push指令
动态链接器ld.so的工作流程:
1. 解析printf在libc.so中的真实地址
2. 将GOT[3]的值替换为真实函数指针
3. 后续调用直接跳转到libc代码段
四、动态节区:链接器的导航地图
通过readelf -d查看关键动态标签:Dynamic section at offset 0x2e00 contains 24 entries:
TAG VALUE
NEEDED libc.so.6
INIT 0x1000
FINI 0x2000
PLTGOT 0x4000 # GOT表地址
JMPREL 0x3800 # 重定位项地址
重定位项结构示例(Elf64_Rela):c
typedef struct {
Elf64_Addr r_offset; // 需要修改的地址(如GOT槽)
Elf64_Xword r_info; // 符号索引 + 重定位类型
Elf64_Sxword r_addend;
} Elf64_Rela;
五、实践:调试运行时链接
使用LD_DEBUG环境变量观察链接过程:bash
LD_DEBUG=bindings ./app
输出示例:10962: binding file /lib/x86_64-linux-gnu/libc.so.6 [0] to /lib/x86_64-linux-gnu/libc.so.6 [0]: normal symbol `printf'
通过gdb查看内存中的GOT:gdb
(gdb) x/3a 0x4000 # 查看GOT前三项
0x4000: 0x00007ffff7ffe1d0 0x0000000000000000 0x00007ffff7fde550
动态链接将物理内存的碎片编织成逻辑连续的程序空间。这种精巧设计使得Linux系统能在有限的物理内存中承载成千上万的进程,犹如用一张乐谱指挥万人大合唱。
