CSAPP 7.链接

yyi
yyi
2023-08-12 / 0 评论 / 145 阅读 / 正在检测是否收录...
温馨提示:
本文最后更新于2023年08月12日,已超过425天没有更新,若内容或图片失效,请留言反馈。

本章的知识在《程序员的自我修养——链接、装载与库》中都有所提到,复习为主。可能有些说法和本书不同,如段Segment和节Section,希望读者自行甄别。

链接:把各种代码和数据片段组合为一个单一文件的过程,这个单一文件可以被加载到内存并执行

当下的链接主要分为静态链接动态链接,静态链接于编译时执行,动态链接由装载或运行时执行。

链接的重要意义之一就是增量编译、分离版本控制。我们需要更新部件的时候无需编译其他部分

1 编译器驱动程序

本章将以如下两段代码作为示例

// main.c
int sum(int *a, int n);

int arr[2] = {1, 2};

int main() {
    int val = sum(arr, 2);
    return val;
}
// sum.c
int sum(int *a, int n) {
    int i, s = 0;
    for(i = 0; i < n; i ++) {
        s += a[i];
    }
    return s;
}

编译器驱动程序可以理解为编译各部分的封装控制器,对于gcc:

gcc -o prog main.c sum.c

它首先调用预处理器cpp,把源程序c文件翻译为ASCII码中间文件i文件main.i

接下来,它调用C编译器cc1,把main.i翻译为一个ASCII汇编语言文件main.s

然后运行汇编器as,把main.s翻译为目标文件main.o,同样的过程生成sum.o,它们是可重定位目标文件

最后运行链接程序ld,把main.o、sum.o和一些其他的系统目标文件链接起来,创建一个可执行目标文件prog

我们运行prog,shell会调用操作系统中的加载器,把prog的代码和数据复制到内存,把控制转移到prog的起始

2 静态链接

静态链接以可重定位目标文件和参数作为输入,生成一个链接后的可执行目标文件

静态链接主要完成两个任务:

  • 符号解析:目标文件中会定义和引用符号,如全局变量,跳转的label、函数,连接器把它们的定义和引用进行关联
  • 重定位:链接器重排布代码和数据段的位置,并对符号引用进行修改,使他们真正指向对应的虚拟内存位置

3 目标文件

目标文件主要分为三种,前两种在上面提到过了,它们是

  • 可重定位目标文件:包含二进制的代码和数据,额可以在链接时与其它可重定位目标文件合并
  • 可执行目标文件:可以直接被复制到内存并执行
  • 共享目标文件:Shared Object so,可以在加载或运行时被动态加载进内存并链接

Windows下使用PE格式,Mac系统使用Mach-O格式,Linux和Unix使用ELF格式

4 可重定位目标文件

ELF由ELF头、段表和各段组成

ELF头中包括一些关键描述信息,如字大小、ELF版本、架构、字节顺序等,还有段表的条目大小和数量,帮助我们索引段表。

一个典型的ELF包含如下几个段:

  • .text: 已编译程序的机器码
  • .rodata: 只读数据,比如switch的jt
  • .data: 已初始化的全局和静态变量
  • .bss: 未初始化、初始化为0的全局和静态变量,它们在目标文件中不占实际空间
  • .symtab: 符号表,存放引用的全局变量和函数信息(但是对执行没有影响,可以通过strip去掉)
  • .rel.text:text中需要重定位的位置列表
  • .rel.data: 同理
  • .debug:调试符号表

5 符号和符号表

符号表包含文件定义和引用符号信息,包括如下三种:

  • 由模块定义、能被其它模块引用的全局符号,对应C的非静态函数和全局变量
  • 由其它模块定义、本模块引用的全局符号,也被称为外部符号,对应其它C文件的非静态函数和全局变量
  • 只被当前模块定义和引用的局部符号,包括static修饰的函数和全局变量,只在模块内部可见

符号表存在于.symtab段,由Elf64_Symbol(显然,也会有32)数组组成

typedef struct {
    int name;
    char type:4, binding:4;
    char reserved;
    short section;
    long value;
    long size;
} Elf64_Symbol;
  • name时字符串表中的字节偏移
  • value是符号的地址,是距定义目标的setcion的起始位置的偏移
  • size是目标的大小
  • type区别数据和函数,binding标识符号是本地还是全局的

此外还有三个特殊的伪节,在段表中不存在

  • ABS:不该被重定位的符号
  • UNDEF:未定义的符号
  • COMMON:未初始化的全局变量,bss是未初始化的静态、初始化为0的全局或静态

6 符号解析

把每个引用与目标文件符号表中的符号定义关联起来

局部符号:每个模块每个局部符号只能有一个定义,静态局部变量名字唯一

全局符号:遇到不在当前模块定义的符号时,假设其它模块定义该符号,生成一个链接器符号表条目,由链接器处理

6.1 多重定义的全局符号

全局符号分强弱,函数和已初始化的全局变量是强符号,未初始化的全局变量是弱符号

如下三条规则处理:

  • 不允许有重名强符号
  • 如果一个强符号和其它弱符号重名,选择强符号
  • 如果多个弱符号重名,随机选择一个

显然,第二条和第三条规则将带来一些我们不想看到的错误,也正是由于这两条规则,才带来了bss和COMMON微小的区别,对于初始化为0或者静态变量,不会存在歧义,编译器会放在bss,对于没有初始化的全局变量,由链接器决定选择COMMON段的哪个。

6.2 静态库链接

编译系统提供一种机制:把相关的目标模块打包成一个文件,称为静态库,linux中后缀为.a的文件就是一系列目标模块的打包。

相关库函数被编译为独立的目标模块,以供链接时使用,当用户目标文件和静态库链接时,链接器复制需要的模块来链接,这避免了程序员手动链接所有目标文件的复杂性,也避免了一次链接所有文件导致的空间浪费。

举个例子,一个带printf调用的main.c,编译时gcc会自动给链接器加上libc.a的参数,ld会从libc.a中扫描到printf.o和其它printf.o引用的模块进行链接。

6.3 链接器如何使用静态库

链接器按顺序从左到右扫描目标文件和存档(archive, .a)文件,维护一个目标文件的结合E、一个未解析符号集合U、一个已定义符号集合D

  • 对于输入文件f,判断f是目标文件还是存档文件,如果是目标文件,添加到E,根据f修改U和D
  • 对于存档文件f,尝试匹配U中未解析符号,如果某个成员m定义了U中需要的符号,把m加到E中,修改U和D。
  • 如果完成之后,U非空,输出错误,否则合并、重定位E中的文件。

注意,链接器按从左到右的顺序,意味着输入顺序很重要,库可以在命令行参数中重复,以满足依赖。

7 重定位

重定位以合并后的文件作为输入,为符号分配运行时地址

  • 重定位节和符号定义:相同的节进行合并,作为输出文件的对应节。将运行时的内存地址赋给对应的节和符号
  • 重定位符号引用:基于重定位条目修改所有的符号引用, 使得引用指向正确的运行时地址

7.1 重定位条目

汇编器生成目标文件,遇到不能确定最终地址的引用时,即生成一个重定位条目,代码的条目放在.rel.text,数据的放在.rel.data

struct {
    long offset;
    long type:32,
             symbol:32;
    long addend;
}Elf64_Rela;

上面这个数据结构就是重定位条目,每个条目表示一个需要重定位的引用。Elf有很多种重定位类型,我们只关心两种。

  • offset:被修改的引用的段偏移
  • symbol:被修改的引用指向的符号
  • type:如何修改新的引用

    • R_X86_64_PC32:32位PC相对地址的引用,比如call指令,PC地址是下条指令的起始地址
    • R_X86_64_32:32位绝对地址的引用
    • 这两种类型支持“小型代码模型”,假设代码和数据的总体大小小于2G,因此可以使用32位相对地址访问。Gcc默认使用小代码模型。
  • addend:一个常数,部分重定位需要使用它对被修改引用的值进行调整。

7.2 重定位符号引用

  • 遍历需要重定位的节
  • 对于所有当前节对应的重定位条目,根据节地址和条目offset取出需要重定位代码的地址
  • 根据条目type,进入不同的分支

    • 若为相对引用,首先获取当前指令的运行时地址

      • 这里其实有点问题,取的到底是当前指令地址、当前指令的引用数据部分地址,还是下条指令的地址?
      • 根据代码的行为,我推测应该是当前指令的引用数据部分地址,再根据addend修正到下条指令的地址(事实上也是这样的)
    • 然后修改需要重定位的字节序列为符号地址+addend-当前指令运行时地址
    • 若为绝对引用,修改重定位的字节序列为符号地址+addend

8 可执行目标文件

对于可执行目标文件,其头部还包括了程序的入口点(Entry Point),记录了程序第一条指令的地址。

程序头部表:描述可执行文件映射到内存的关系,记录了段在目标文件中的偏移、内存地址、对齐、目标文件中的段大小、内存中的段大小和访问权限(rwx)。

9 可执行文件的加载

shell通过execve函数调用加载器,将ELF的代码和数据从磁盘复制到内存(实际上,应该只是简单建立映射,复制的工作似乎会由访问时的页错误完成,书中可能会在后面提到)然后跳转到程序的第一条指令或者入口点。

Linux程序都会有一个运行时内存镜像,其结构我们在第三章中应该介绍过了。

10. 动态链接库

静态库有一些缺点:

  • 静态库更新时,程序员需要显式的重新链接
  • 比如printf这种函数,会在上百个进程的text段中分别存放,造成极大的浪费

在内存加载时,共享库加载到内存的任意地址,并和内存中程序链接起来。Linux中为so(shared object),Win下为DLL(Dynamic Link Lib),Mac下为dylib

在给定的文件系统中,一个库只有一个so文件,所有引用该库的文件共享这个so的代码和数据(可读写的数据似乎应该是进程独立的,不知道这里书上这么说是指什么,可能是只代表只读数据)。

动态链接的过程会发生在加载时、加载器首先运行动态链接器、之后再由动态链接器把控制交还应用程序

11 应用程序中加载和链接共享库

Linux提供了一个接口,允许程序运行时加载链接库

#include <dlfcn.h>
void *dlopen(const char *filename, int flag);
void *dlsym(void* handle, char* symbol);
int dlclose(void *handle);

dlopen函数加载共享库filename,根据flag的标志决定何时进行符号解析。成功返回一个handle指针,出错为NULL

dlsym根据handle和符号名字返回符号地址

dlclose在共享库空闲时卸载该共享库。

12 位置无关代码(每次读这块都头疼)

PIC位置无关代码:可以加载而无需重定位的代码。

共享库需要通过这种方式来实现“加载到任意内存位置”,因为重定位时我们需要知道符号地址,而共享库是运行时才能确定地址的。

12.1 数据引用

全局偏移量表GOT:这个表在数据段开始的地方,每个被模块引用的全局数据目标都会在GOT表中有一个8字节条目,加载时动态链接器重定位GOT表中的每个条目,使得它包含目标正确的绝对地址。由于代码段和数据段之间距离不变,编译器产生的代码引用GOT中的条目对数据进行间接访问。

12.2 函数调用

延迟绑定:把过程地址绑定推迟到低依次调用过程时。

延迟绑定可以很好的避免加载时进行不必要的重定位,GNU通过GOT和过程链接表PLT实现这个机制。GOT时数据段的一部分,PLT时代码段的一部分。

  • PLT:PLT的每个条目是16字节代码,PLT[0]跳转到动态链接器中。每个条目负责一个具体的函数

在这里,GOT除了前几个为动态链接器保留的条目外,每个条目对应一个函数,也对应一个PLT条目。GOT条目初始时指向对应的PLT条目的第二条指令。

PLT的一个条目是这样的:

4005a0: pushq *GOT[1]
4005a6: jmpq *GOT[2]
----
4005c0: jmpq *GOT[4]
4005c6: pushq $0x1
4005cb: jmpq 4005a0

GOT4对应这下面这条PLT(下面称为PLT2)。GOT0和GOT1包含动态链接器模块的地址,GOT2是动态链接器在ld-linux.so的入口点

当发生第一次调用时,程序进入PLT2,PLT2对应我们要调用的函数f

第一条PLT通过GOT4进行跳转,初始时GOT对应PLT的第二条指令,因此又跳到下面那条pushq指令上

把函数f的ID(1)压入栈之后,跳转到PLT0,PLT0通过GOT1间接的把动态链接器的参数压栈,通过GOT2跳转到动态链接器中,动态链接器利用这两个栈上参数确定f的运行时位置,把这个地址重写给GOT4,再把控制交还给f

在这之后,控制第二次传递到PLT2时,它会跳转到GOT4上保存的地址,而这个地址正是f的地址。

13 库打桩机制

我理解就是hook,可以截获调用,执行自己的代码,Hook可以发生在编译、链接和运行时。其实就是把调用函数替换成我们自己的实现嘛。这里不赘述了

14 处理目标文件的工具

  • AR:创建静态库、插入删除列举提取成员
  • strings:列出目标文件中可打印字符串
  • strip:删除符号表信息
  • nm:列出符号表中的符号
  • size:列出节的名字和大小
  • readelf:显示目标文件的完整结构
  • objdump:显示目标文件所有信息,尤其是可以反汇编text中的指令。
  • ldd:列出需要的共享库
0

评论 (0)

取消