当前位置: 首页 > news >正文

Google Benchmark性能测试

Google Benchmark性能测试

Google Benchmark 是一个用于 C++ 的微基准测试框架,专为测量小块代码的性能而设计。它提供了一种简单而强大的方式来编写、运行和分析基准测试,帮助开发人员识别性能瓶颈并优化代码。本教程将从安装和基本用法开始,逐步深入到高级功能,并通过 C++ 示例演示如何结合测试实践。


1. 安装 Google Benchmark

在 Ubuntu 上安装 Google Benchmark 非常简单。以下是安装步骤:

  1. 更新软件包列表

    sudo apt-get update
    
  2. 安装 Google Benchmark

    sudo apt-get install libbenchmark-dev
    
  3. 验证安装
    安装完成后,你可以通过编译一个简单的基准测试程序来验证安装是否成功。


2. 基本用法

Google Benchmark 的基本用法是定义一个基准测试函数,并使用 BENCHMARK 宏注册它。以下是一个简单的示例:

示例 1:测量函数执行时间

代码
#include <benchmark/benchmark.h>
#include <chrono>
#include <thread>

void BM_Sleep(benchmark::State& state) {
    for (auto _ : state) {
        std::this_thread::sleep_for(std::chrono::milliseconds(100));
    }
}

BENCHMARK(BM_Sleep);

BENCHMARK_MAIN();
编译和运行
  1. 编译

    g++ -std=c++11 -O2 -o benchmark_example benchmark_example.cpp -lbenchmark -lpthread
    
    • -lbenchmark 链接 Google Benchmark 库。
    • -lpthread 链接 pthread 库(Google Benchmark 依赖)。
  2. 运行

    ./benchmark_example
    
输出分析

运行后,你将看到类似以下的输出:

2023-10-01 12:00:00
Running ./benchmark_example
Run on (8 X 4200 MHz CPU s)
CPU Caches:
  L1 Data 32 KiB (x4)
  L1 Instruction 32 KiB (x4)
  L2 Unified 256 KiB (x4)
  L3 Unified 8192 KiB (x1)
***WARNING*** CPU scaling is enabled, the benchmark real time measurements may be noisy and will incur extra overhead.
---------------------------------------------------------
Benchmark               Time             CPU   Iterations
---------------------------------------------------------
BM_Sleep         100000000 ns    100000000 ns           7
  • Time:每次迭代的平均时间。
  • CPU:每次迭代的 CPU 时间。
  • Iterations:基准测试运行的迭代次数。

示例 2:测量不同参数下的性能

Google Benchmark 允许你通过 RangeArgs 指定参数,测试不同输入下的性能。

代码
#include <benchmark/benchmark.h>
#include <vector>

void BM_VectorPushBack(benchmark::State& state) {
    for (auto _ : state) {
        std::vector<int> v;
        for (int i = 0; i < state.range(0); ++i) {
            v.push_back(i);
        }
    }
}

BENCHMARK(BM_VectorPushBack)->Range(8, 8<<10);

BENCHMARK_MAIN();
编译和运行
  1. 编译

    g++ -std=c++11 -O2 -o benchmark_range benchmark_range.cpp -lbenchmark -lpthread
    
  2. 运行

    ./benchmark_range
    
输出分析

输出将显示不同 vector 大小下的性能:

---------------------------------------------------------
Benchmark               Time             CPU   Iterations
---------------------------------------------------------
BM_VectorPushBack/8          10 ns          10 ns    10000000
BM_VectorPushBack/64         80 ns          80 ns     1000000
BM_VectorPushBack/512       640 ns         640 ns      100000
BM_VectorPushBack/4096     5120 ns        5120 ns       10000
BM_VectorPushBack/32768   40960 ns       40960 ns        1000

这表明随着 vector 大小的增加,push_back 操作的耗时也相应增加。


3. 高级功能

Google Benchmark 还提供了一些高级功能,帮助你更精细地控制基准测试。

3.1 自定义计时

你可以使用 DoNotOptimizeClobberMemory 来防止编译器优化掉你的代码。

代码
#include <benchmark/benchmark.h>

void BM_CustomTiming(benchmark::State& state) {
    for (auto _ : state) {
        int result = 0;
        for (int i = 0; i < 1000; ++i) {
            result += i;
        }
        benchmark::DoNotOptimize(result);
        benchmark::ClobberMemory();
    }
}

BENCHMARK(BM_CustomTiming);

BENCHMARK_MAIN();
  • DoNotOptimize:防止编译器优化掉 result
  • ClobberMemory:确保内存操作不被优化。

3.2 测量内存使用

Google Benchmark 允许你测量内存使用情况。

代码
#include <benchmark/benchmark.h>
#include <vector>

void BM_MemoryUsage(benchmark::State& state) {
    for (auto _ : state) {
        std::vector<int> v(state.range(0), 0);
        benchmark::DoNotOptimize(v.data());
    }
    state.SetBytesProcessed(state.iterations() * state.range(0) * sizeof(int));
}

BENCHMARK(BM_MemoryUsage)->Range(8, 8<<10);

BENCHMARK_MAIN();
  • SetBytesProcessed:设置每次迭代处理的字节数,用于计算吞吐量。

3.3 多线程基准测试

你可以使用 Threads 指定线程数,测试多线程环境下的性能。

代码
#include <benchmark/benchmark.h>
#include <atomic>

std::atomic<int> counter(0);

void BM_AtomicIncrement(benchmark::State& state) {
    for (auto _ : state) {
        counter++;
    }
}

BENCHMARK(BM_AtomicIncrement)->Threads(4);

BENCHMARK_MAIN();
  • Threads(4):在 4 个线程中运行基准测试。

4. 结合测试实践

在实际开发中,基准测试应与单元测试和性能分析工具结合使用,以确保代码的正确性和高效性。

4.1 与单元测试集成

你可以在 CI/CD 管道中运行基准测试,监控性能变化。

4.2 与性能分析工具结合

使用 perfValgrind 等工具,深入分析基准测试结果,定位瓶颈。


相关文章:

  • 质检LIMS系统在粮油加工企业的应用 粮油质检LIMS系统应用的痛点
  • AP CSA FRQ Q2 Past Paper 五年真题汇总 2023-2019
  • 单多表查询练习
  • jmm-java内存模型
  • 工厂模式a
  • 习题4-9 打印菱形图案
  • 全分辨率免ROOT懒人精灵-自动化编程思维-设计思路-实战训练
  • Arduino、ESP32驱动BME688环境传感器(环境传感器篇)
  • 模拟curl的回调函数实现返回结构体
  • 基于Spring Boot的ONLY在线商城系统设计与实现的设计与实现(LW+源码+讲解)
  • Ubuntu xinference部署本地模型bge-large-zh-v1.5、bge-reranker-v2-m3
  • Headless Chrome 优化:减少内存占用与提速技巧
  • c++随记
  • 糖尿病大模型预测及临床应用研究智能管理系统技术文档
  • 线段树SegmentTree
  • HTML5 Audio(音频)学习笔记
  • Elasticsearch客户端工具初探--kibana
  • PyTorch处理数据--Dataset和DataLoader
  • Springboot高版本适配人大金仓
  • qtcore在docker容器中运行
  • 观察|本轮印巴冲突或促使印度空军寻求更先进战机
  • 黄仕忠丨戏曲文献研究之回顾与展望
  • 中国人民抗日战争暨世界反法西斯战争胜利80周年纪念活动标识发布
  • 广西壮族自治区党委政法委副书记李文博接受审查调查
  • 1至4月全国铁路完成固定资产投资1947亿元,同比增长5.3%
  • 巴基斯坦称对印精准打击造成设施损坏和人员伤亡