C++之虚函数、虚函数表
C++ 虚函数、虚函数表详解与实践
C++中虚函数是实现多态的重要技术,接下来将从汇编、以及gdb调试运行方面下手全面了解虚函数、虚函数表、以及虚函数调用。
原理初认识
- 一个由虚函数的类将会有一个虚函数表,且所有该类的实例化对象共享一个虚函数表。
- 虚函数表将存在代码的.data.rel.ro段中(该段表示需要重定位的只读数据段),在代码(elf可执行文件)的.rela.dyn段中指出了需要重定位的条目。
- 每个有虚函数的类的实例化对象都有一个指向该类虚函数表的成员指针变量(编译器自动创建)。
- 虚函数的调用会根据对象中的虚函数表去找对应的虚函数地址,然后再去调用对应的虚函数。
- 虚函数表的初始化是在编译时期(编译器直接将对应的虚函数地址放入虚函数表中),实例化对象的指向虚函数表的指针初始化是在构造函数中,其中指向虚函数表的指针是实现动态多态的重要技术。
- 类的构造函数不能是虚函数(原因见下面2.1的分析)。
一探究竟
1. 测试源代码
#include <iostream>
// 父类
class Base {
public:
        // 纯虚函数
        virtual void call() = 0;
};
// 子类
class SON : public Base {
public:
        // 重写父类纯虚函数
        void call() override {
                std::cout << "vir son call\n";
        }
};
int main()
{
        Base* myson = new SON;
        // 调用重写的call函数
        myson->call();
        return 0;
}
2. 汇编代码分析
- 调用流程分析 
  - main函数中会先调用- SON的构造函数。
- SON的构造函数中会调用父类- Base的构造函数,然后返回- SON的构造函数。
- SON构造函数中会进行虚函数表指针的初始化(将- SON类的虚函数表首地址放入该对象的虚函数表指针中)。
- SON构造函数完成剩下其他初始化就返回到- main函数中。
 
-  由于是先调用父类的构造函数再初始化虚函数表指针,所以如果父类构造函数是虚函数的话,在子类对象虚函数表指针都还没初始化就去调用重写的虚构造函数显然是不行的(因为虚函数表指针都没初始化,怎么能调用到重写的虚构造函数)。 
-  对应的汇编代码截屏 
  
-  虚函数表所对应的 .data.rel.ro段,虚函数表地址为0x11d18,其中存放的重写的call函数地址为0xfd8.
  
-  SON类重写的call函数汇编代码截屏(地址分配为0xfd8)
  - 从图二可以看出,在编译阶段编译器就已经将重写的call地址放入了虚函数表中,所以可以知道了虚函数的初始化是在编译阶段。
- 从上面三张截屏可以看出来在SON的构造函数中会将该类的虚函数地址放入该对象的虚函数表指针中,所以可以知道了对象的虚函数表指针初始化是在构造函数阶段。
 
- 从图二可以看出,在编译阶段编译器就已经将重写的
- 在elf可执行程序执行时,看看虚函数表中对重写的虚函数地址的重定位。
-  .rela.dyn段的截屏,可以看出重定位表项记录了重写的call函数地址需要在加载时重新修改(重定位)
  
-  gdb调试时虚函数表中重写虚函数的实际地址截屏,可以看出确实被重定位了指向了重写的 call函数的真实地址
  
-  虚函数的调用 
  // 将实例化myson的this指针放入x0寄存器中 f38: f94017e0 ldr x0, [sp, #40] // 取出myson的第一个成员变量(即虚函数表指针) f3c: f9400000 ldr x0, [x0] // 访问虚函数表指针指向的空间(即虚函数表第一个表项)并将其放入x1寄存器中(此时x1寄存器中的值就是重写的call函数地址) f40: f9400001 ldr x1, [x0] // 将myson的this指针放入x0寄存器中 f44: f94017e0 ldr x0, [sp, #40] // 函数跳转至x1寄存器中存放的地址(即重写的call函数地址) f48: d63f0020 blr x1
总结
- 在此C++虚函数、虚函数表相关的知识点已经全部从实践的角度分析完。相关结论在1.原理初认识的时候就已经给出。
附录重要汇编代码
感兴趣的朋友可以细看
- .rela.dyn段
Relocation section '.rela.dyn' at offset 0xa50 contains 20 entries:
  Offset          Info           Type           Sym. Value    Sym. Name + Addend
000000011cf0  000000000403 R_AARCH64_RELATIV                    f10
000000011cf8  000000000403 R_AARCH64_RELATIV                    fbc
000000011d00  000000000403 R_AARCH64_RELATIV                    ec0
000000011d10  000000000403 R_AARCH64_RELATIV                    11d38
000000011d18  000000000403 R_AARCH64_RELATIV                    fd8
000000011d28  000000000403 R_AARCH64_RELATIV                    11d50
000000011d40  000000000403 R_AARCH64_RELATIV                    1088
000000011d48  000000000403 R_AARCH64_RELATIV                    11d50
- main函数
0000000000000f14 <main>:
     f14:       a9bd7bfd        stp     x29, x30, [sp, #-48]!
     f18:       910003fd        mov     x29, sp
     f1c:       f9000bf3        str     x19, [sp, #16]
     f20:       d2800100        mov     x0, #0x8                        // #8
     f24:       97ffff93        bl      d70 <_Znwm@plt>
     f28:       aa0003f3        mov     x19, x0
     f2c:       aa1303e0        mov     x0, x19
     f30:       9400003e        bl      1028 <_ZN3SONC1Ev>
     f34:       f90017f3        str     x19, [sp, #40]
     f38:       f94017e0        ldr     x0, [sp, #40]
     f3c:       f9400000        ldr     x0, [x0]
     f40:       f9400001        ldr     x1, [x0]
     f44:       f94017e0        ldr     x0, [sp, #40]
     f48:       d63f0020        blr     x1
     f4c:       52800000        mov     w0, #0x0                        // #0
     f50:       f9400bf3        ldr     x19, [sp, #16]
     f54:       a8c37bfd        ldp     x29, x30, [sp], #48
     f58:       d65f03c0        ret
- SON、- Base类构造函数、重写的- call函数
0000000000000fd8 <_ZN3SON4callEv>:
     fd8:       a9be7bfd        stp     x29, x30, [sp, #-32]!
     fdc:       910003fd        mov     x29, sp
     fe0:       f9000fe0        str     x0, [sp, #24]
     fe4:       b0000000        adrp    x0, 1000 <_ZN3SON4callEv+0x28>
     fe8:       9101e001        add     x1, x0, #0x78
     fec:       b0000080        adrp    x0, 11000 <__FRAME_END__+0xfdbc>
     ff0:       f947ec00        ldr     x0, [x0, #4056]
     ff4:       97ffff5b        bl      d60 <_ZStlsISt11char_traitsIcEERSt13basic_ostreamIcT_ES5_PKc@plt>
     ff8:       d503201f        nop
     ffc:       a8c27bfd        ldp     x29, x30, [sp], #32
    1000:       d65f03c0        ret
0000000000001004 <_ZN4BaseC1Ev>:
    1004:       d10043ff        sub     sp, sp, #0x10
    1008:       f90007e0        str     x0, [sp, #8]
    100c:       90000080        adrp    x0, 11000 <__FRAME_END__+0xfdbc>
    1010:       9134c001        add     x1, x0, #0xd30
    1014:       f94007e0        ldr     x0, [sp, #8]
    1018:       f9000001        str     x1, [x0]
    101c:       d503201f        nop
    1020:       910043ff        add     sp, sp, #0x10
    1024:       d65f03c0        ret
0000000000001028 <_ZN3SONC1Ev>:
    1028:       a9be7bfd        stp     x29, x30, [sp, #-32]!
    102c:       910003fd        mov     x29, sp
    1030:       f9000fe0        str     x0, [sp, #24]
    1034:       f9400fe0        ldr     x0, [sp, #24]
    1038:       97fffff3        bl      1004 <_ZN4BaseC1Ev>
    103c:       90000080        adrp    x0, 11000 <__FRAME_END__+0xfdbc>
    1040:       91346001        add     x1, x0, #0xd18
    1044:       f9400fe0        ldr     x0, [sp, #24]
    1048:       f9000001        str     x1, [x0]
    104c:       d503201f        nop
    1050:       a8c27bfd        ldp     x29, x30, [sp], #32
    1054:       d65f03c0        ret
- .data.rel.ro段,虚函数表
Disassembly of section .data.rel.ro:
0000000000011d08 <_ZTV3SON>:
        ...
   11d10:       00011d38        .inst   0x00011d38 ; undefined
   11d14:       00000000        udf     #0
   11d18:       00000fd8        udf     #4056
   11d1c:       00000000        udf     #0
0000000000011d20 <_ZTV4Base>:
        ...
   11d28:       00011d50        .inst   0x00011d50 ; undefined
