当前位置: 首页 > wzjs >正文

网站营销工具百度贴吧入口

网站营销工具,百度贴吧入口,php怎么编写网页,2023年封城通知一、SIMD编程中的条件分支问题 在传统标量代码中&#xff0c;我们习惯使用if-else进行条件判断&#xff1a; void scalar_conditional(float* arr, int n) {for (int i 0; i < n; i) {if (arr[i] > 0) {arr[i] * 2;}} }但在AVX向量化编程中&#xff0c;直接条件分支会…

一、SIMD编程中的条件分支问题

在传统标量代码中,我们习惯使用if-else进行条件判断:

void scalar_conditional(float* arr, int n) {for (int i = 0; i < n; ++i) {if (arr[i] > 0) {arr[i] *= 2;}}
}

但在AVX向量化编程中,直接条件分支会引发两个关键问题:

  1. ​分支预测失败惩罚:当条件模式不规则时,流水线频繁刷新
  2. SIMD并行性破坏:8个float元素(256位寄存器)可能同时包含满足和不满足条件的元素

二、AVX掩码操作原理

2.1 核心思想

通过向量比较生成掩码(mask),使用位操作混合计算结果:

寄存器A: [ 1.0, -2.0, 3.0, -4.0, 5.0, -6.0, 7.0, -8.0 ]
掩码   : [ 0xFF, 0x00, 0xFF, 0x00, 0xFF, 0x00, 0xFF, 0x00 ] 
结果   = 原始值 * (掩码 ? 2.0 : 1.0)

2.3 AVX掩码操作指令集

指令类别典型指令操作描述延迟周期
比较指令_mm256_cmp_ps生成全通道掩码3
混合指令_mm256_blendv_ps根据掩码选择通道2
位逻辑运算_mm256_and_ps/_mm256_or_ps掩码逻辑操作1
条件加载_mm256_maskload_ps根据掩码加载内存4
算术运算_mm256_mask_add_ps带掩码的加法(AVX-512)N/A

三、VS2022实现示例

3.1 向量化条件处理

#include <immintrin.h>void avx_conditional(float* arr, int n) {const __m256 zero = _mm256_setzero_ps();const __m256 mul = _mm256_set1_ps(2.0f);for (int i = 0; i < n; i += 8) {__m256 data = _mm256_loadu_ps(arr + i);// 生成比较掩码(arr[i] > 0)__m256 mask = _mm256_cmp_ps(data, zero, _CMP_GT_OQ);// 计算两种可能的结果__m256 res_true = _mm256_mul_ps(data, mul);__m256 res_false = data;// 根据掩码混合结果__m256 result = _mm256_blendv_ps(res_false, res_true, mask);_mm256_storeu_ps(arr + i, result);}
}

3.2 完整代码

#include <immintrin.h>
#include <chrono>
#include <iostream>void scalar_conditional(float* arr, int n) {for (int i = 0; i < n; ++i) {if (arr[i] > 0) {arr[i] *= 2;}}
}void avx_conditional(float* arr, int n) {const __m256 zero = _mm256_setzero_ps();const __m256 mul = _mm256_set1_ps(2.0f);for (int i = 0; i < n; i += 8) {__m256 data = _mm256_loadu_ps(arr + i);// 生成比较掩码(arr[i] > 0)__m256 mask = _mm256_cmp_ps(data, zero, _CMP_GT_OQ);// 计算两种可能的结果__m256 res_true = _mm256_mul_ps(data, mul);__m256 res_false = data;// 根据掩码混合结果__m256 result = _mm256_blendv_ps(res_false, res_true, mask);_mm256_storeu_ps(arr + i, result);}
}void benchmark() {const int SIZE = 10000000;float* data = new float[SIZE];// 初始化随机数据for (int i = 0; i < SIZE; ++i) {data[i] = (i % 2) ? i * 0.1f : -i * 0.1f;}auto t1 = std::chrono::high_resolution_clock::now();scalar_conditional(data, SIZE);auto t2 = std::chrono::high_resolution_clock::now();avx_conditional(data, SIZE);auto t3 = std::chrono::high_resolution_clock::now();std::cout << "Scalar: "<< std::chrono::duration_cast<std::chrono::milliseconds>(t2 - t1).count()<< "ms\n";std::cout << "AVX:    "<< std::chrono::duration_cast<std::chrono::milliseconds>(t3 - t2).count()<< "ms\n";delete[] data;
}int main() {benchmark();return 0;
}

3.3 测试结果

在这里插入图片描述

http://www.dtcms.com/wzjs/101004.html

相关文章:

  • 先建网站还是先做网页seo诊断
  • 微信官网网站模板下载不了目前疫情最新情况
  • 枣庄网站设计广州seo网站推广优化
  • 政府网站建设工作会议凡科建站怎么用
  • 做网站需要什么电脑西安seo优化
  • 国外做游戏的视频网站有哪些开电商需要多少钱
  • 手机怎么做微电影网站吗网站排名查询alexa
  • 哪里有创建网站的网站怎么打开
  • 学校校园网站建设方案成人专业技能培训机构
  • wordpress大学主优化标题关键词技巧
  • 深圳定制专业网站引擎搜索有哪些
  • 平面设计适合女生学吗网站推广优化的方法
  • 做网站 图片格式南宁网络推广培训机构
  • 可信网站证书推广运营怎么做
  • 南宁网站定制公司上海网站优化
  • 做网站收录的网站有哪些seo在线排名优化
  • 做网站有几种语言网站制作流程
  • 可以上传自己做的视频的网站宁波企业网站seo
  • 自己怎么做商城网站吗seo快速优化
  • 绍兴网站建设专业的公司网站优化招聘
  • 商丘做微信网站sqwyy产品网络推广方式
  • 国内做网站徐州自动seo
  • 抚顺建设银行网站哈尔滨电话本黄页
  • 淘宝联盟 做网站百度seo和sem的区别
  • tk域名官方网站百度用户服务中心官网
  • 做淘宝客网站制作教程视频免费网站统计工具
  • html技术的简介seo站内优化包括
  • 房山区住房和城乡建设委员会网站新平台推广赚钱
  • 江西医疗网站建设网站关键词优化案例
  • 青海教育厅门户网站网络服务中心