当前位置: 首页 > news >正文

012-Benchmark

Benchmark

以下是一篇关于Google Benchmark库的全面介绍及使用指南,包含完整C++代码示例和核心功能覆盖:

Google Benchmark:C++ 性能基准测试指南

一、库简介

Google Benchmark 是一个专为 C++ 设计的微基准测试库,用于精确测量代码片段的执行效率。其核心特性包括:

  • 多维度测试:支持参数化测试、多线程场景和自定义数据规模
  • 智能迭代:自动计算最佳迭代次数保证统计显著性
  • 精准计时:提供真实时间(wall time)和 CPU 时间双维度测量
  • 跨平台支持:兼容 Linux/Windows/macOS,支持 CMake 构建

二、环境安装

通过源码编译(推荐):

1. 安装依赖
sudo apt install git cmake build-essential 
2. 克隆仓库
git clone https://github.com/google/benchmark.git  
cd benchmark 
3. 构建安装
cmake -E make_directory build 
cmake -S . -B build -DBENCHMARK_DOWNLOAD_DEPENDENCIES=ON 
cmake --build build --config Release 
sudo cmake --install build 

三、基础使用

  • 示例1:基本性能测试
#include <benchmark/benchmark.h>
 
static void BM_StringCreation(benchmark::State& state) {
    for (auto _ : state) {
        std::string empty_string;
        benchmark::DoNotOptimize(empty_string); // 防止编译器优化 
    }
}
BENCHMARK(BM_StringCreation);
 
static void BM_StringCopy(benchmark::State& state) {
    std::string x = "hello";
    for (auto _ : state) {
        std::string copy(x);
        benchmark::ClobberMemory(); // 强制内存操作计入计时 
    }
}
BENCHMARK(BM_StringCopy);
 
BENCHMARK_MAIN();

输出解读:

BM_StringCreation        3.27 ns         3.27 ns    210470863 
BM_StringCopy           21.35 ns        21.35 ns     32765432 
  • 第一列:测试名称
  • 第二列:每次迭代实际耗时(纳秒)
  • 第三列:CPU 时间
  • 第四列:自动计算的迭代次数

四、进阶功能

  1. 参数化测试
static void BM_VectorPushBack(benchmark::State& state) {
    for (auto _ : state) {
        std::vector<int> v;
        v.reserve(state.range(0)); 
        for (int i = 0; i < state.range(0);  ++i) {
            v.push_back(i); 
        }
    }
    state.SetComplexityN(state.range(0));  // 复杂度分析 
}
// 测试不同数据规模:8, 64, 512, 4096
BENCHMARK(BM_VectorPushBack)->RangeMultiplier(8)->Range(8, 4096)->Complexity();
 
// 多参数测试 
BENCHMARK(BM_SomeFunc)->Args({128, 256})->Args({512, 1024});
  1. 多线程测试
static void BM_AtomicIncrement(benchmark::State& state) {
    std::atomic<int> val(0);
    for (auto _ : state) {
        benchmark::DoNotOptimize(val.fetch_add(1)); 
    }
    state.SetItemsProcessed(state.iterations()); 
}
BENCHMARK(BM_AtomicIncrement)->Threads(2)->Threads(4)->UseRealTime();
  1. 计时控制
static void BM_PausedTiming(benchmark::State& state) {
    std::vector<int> data;
    for (auto _ : state) {
        state.PauseTiming(); // 暂停计时 
        data = GenerateRandomData(1000);
        state.ResumeTiming(); // 恢复计时 
        ProcessData(data);
    }
}
BENCHMARK(BM_PausedTiming);

五、完整测试案例

#include <benchmark/benchmark.h>
#include <vector>
#include <algorithm>
 
// 测试不同排序算法的性能 
template <typename T>
static void BM_Sort(benchmark::State& state) {
    std::vector<T> data(state.range(0)); 
    std::generate(data.begin(),  data.end(),  []{ return rand() % 1000; });
    
    for (auto _ : state) {
        state.PauseTiming();
        auto temp = data; // 复制数据避免原地排序影响 
        state.ResumeTiming();
        
        std::sort(temp.begin(),  temp.end()); 
    }
    state.SetBytesProcessed(state.iterations()  * data.size()  * sizeof(T));
}
 
BENCHMARK_TEMPLATE(BM_Sort, int)->Range(1<<10, 1<<20)->Unit(benchmark::kMillisecond);
 
// 多线程版本 
static void BM_ParallelSort(benchmark::State& state) {
    std::vector<int> data(state.range(0)); 
    std::generate(data.begin(),  data.end(),  []{ return rand() % 1000; });
    
    for (auto _ : state) {
        auto temp = data;
        benchmark::DoNotOptimize(temp.data()); 
        std::sort(std::execution::par, temp.begin(),  temp.end()); 
    }
}
BENCHMARK(BM_ParallelSort)->Range(1<<20, 1<<24)->Threads(4)->UseRealTime();
 
BENCHMARK_MAIN();

六、最佳实践

  • 避免优化干扰:使用 benchmark::DoNotOptimize() 和 benchmark::ClobberMemory()
  • 合理设置范围:通过 ->Range() 和 ->Arg() 覆盖典型用例和边界条件
  • 复杂度分析:结合 SetComplexityN() 和 ->Complexity() 进行算法复杂度验证
  • 资源统计:使用 SetBytesProcessed() 和 SetItemsProcessed() 统计吞吐量
  • 结果可视化:通过 --benchmark_format=console|json 输出格式控制

七、扩展功能

  • 自定义报告格式:继承 benchmark::ConsoleReporter 实现自定义输出
  • 内存统计:集成 benchmark::MemoryManager 跟踪内存使用情况
  • 对比测试:使用 BENCHMARK_MAIN() 自动生成的对比表格
  • Python集成:通过 pybind11 实现 Python 脚本控制测试流程
    通过以上方法和示例,开发者可以全面掌握代码性能特征,做出基于数据的优化决策。Google Benchmark 的详细文档可通过其 GitHub 仓库获取。

完整代码

Github

作者郑天佐
邮箱zhengtianzuo06@163.com
主页http://www.zhengtianzuo.com
githubhttps://github.com/zhengtianzuo

相关文章:

  • csdn码字员的第2*2^10天
  • Android Retrofit 框架配置与构建模块深入源码分析(六)
  • 微软程序控制机制WDAC
  • 自动化的多线程实现
  • Spring中的对象创建与生命周期管理
  • Gateway:网关路由与登录鉴权
  • 手机端安装包签名原理
  • 下载文件,文件名乱码问题
  • sql server 2016 版本补丁说明
  • 在unsloth框架下的基于医疗deepseek模型微调
  • 257. 二叉树的所有路径(递归+回溯)
  • 树莓派 调用摄像头
  • clickhouse集群部署保姆级教程
  • C++相关数据结构的API调用
  • qemu-kvm源码解析-内存虚拟化
  • CUDA error code 201:invalid device context
  • 《灵珠觉醒:从零到算法金仙的C++修炼》卷三·天劫试炼(32)万剑归宗破妖阵 - 最长递增子序列(LIS)
  • 有哪些好用的AI视频加工创作网站
  • SpringBoot整合JPA
  • 使用 ConfigMaps 可以优化 Spring Boot应用
  • 广东早熟荔枝“抢滩”上海,向长三角消费者喊话:包甜,管够
  • 沙县小吃中东首店在沙特首都利雅得开业,首天营业额5万元
  • 刘国中:持续加强护士队伍建设,更好保障人民身体健康
  • 哈佛新论文揭示 Transformer 模型与人脑“同步纠结”全过程!AI也会犹豫、反悔?
  • 超新星|罚丢点球的那道坎,刘诚宇靠自己迈了过去
  • A股高开高走:沪指涨0.82%,创指涨2.63%,超4100股收涨