当前位置：首页 > news >正文

硬件加速（FPGA）

news 2025/7/12 8:25:05

最高效的计算方式应该是怎样的？

现在大家应该都知道了，计算的瓶颈往往不在于运算单元数量的不够或是速度不够高，而是在内存带宽上，也就是数据读写来不及，运算单元喂不饱。那最高效的计算方式自然就是能充分利用片上高速内存，让运算单元等待数据的情况从不发生，同时尽可能的减少了对外部DDR的读写，这也同时降低了功耗，所以既要速度快又要功耗低这两者其实并不矛盾。

为什么FPGA比GPU的能耗更低呢？上面讲的是原因之一，还有一个原因是FPGA是硬件可编程，所以它的数据通路是最直接的。比如说用FPGA算两个数相加，那直接把两个数从内存读进来送到加法器那去加就行了。但在GPU中还要进行指令译码，知道是做加法之后还要把这两个数往加法器那里送，这中间数据要经过一些选通器才会被正确的送到加法器那而不是别的运算单元那里。译码，数据经过选通，这些都会产生额外的功耗。而FPGA每次要做的运算都是固定的，所以不需要指令译码，也基本不需要数据的选通。

http://www.dtcms.com/a/274164.html

相关文章：

函数指针指针函数智能指针

通过ETL工具，高效完成达梦数据库数据同步至数仓Oracle的具体实现

MDSE模型驱动的软件工程和敏捷开发相结合的案例

Django 视图（View）

指令重排序带来的多线程问题与volatile解决方案

Linux设备树(dts/dtsi/dtb、设备树概念，设备树解析，驱动匹配)

P1204 [USACO1.2] 挤牛奶Milking Cows

如何设置直播间的观看门槛，让直播间安全有效地运行？

云原生周刊：镜像兼容性

假日流量红利：如何用ASO策略抢占季节性下载高峰？

不同质押周期对代币价格稳定性的具体影响及数据支撑

MinIO文件存储服务工具详细使用指南

和服腰封改造：3种解构主义造型的东方美学新解

2025年亚太中文赛赛题浅析-助攻快速选题

【氮化镓】100 V GaN晶体管在关态应力下的双退化

Spring Boot中请求参数读取方式

HTTP 请求方法详解：GET、POST、PUT、DELETE 等

Python中类静态方法：@classmethod/@staticmethod详解和实战示例

LeetCode 278. 第一个错误的版本

基于生产者消费者模型的线程池【Linux操作系统】

mysql中的自增ID

物联网-ESP8266

API、MCP Client、MCP Server、LLM之间的业务逻辑关系

医疗预约系统中的录音与图片上传功能实现：Vue3+Uniapp 实战

在线重装 Proxmox VE

Swift中SwiftyJSON使用详情

墙裂推荐！McpStore库三行代码为Agent添加MCP能力

业务建模如何让金融数字化转型 “轻” 装上

CentOS7环境安装包部署并配置MySQL5.7

什么是proxy