当前位置: 首页 > news >正文

NPU、边缘计算与算力都是什么啊?

考虑到灵活性和经济性,公司购置一台边缘计算机,正在尝试将PC+GPU的计算机视觉项目转到边缘计算机+NPU上。本文简单整理了三个概念,并试图将其做个概要的说明。


一、算力:数字世界的“基础能源”

1.1 算力是什么

**算力(Computing Power)**是处理信息数据并输出目标结果的能力。从远古人类的结绳计数,到1946年ENIAC计算机每秒5000次加法运算,再到现代超算的百亿亿次浮点运算,算力始终是人类能力的延伸。

在AI时代,算力的核心指标从传统的**FLOPS(浮点运算次数)TOPS(每秒万亿次操作)**转变。以自动驾驶芯片为例,支持L4级自动驾驶的芯片需要至少50 TOPS算力,这相当于每秒完成50万亿次矩阵乘加运算。

1.2 算力相关产业链

  • 上游:芯片(CPU/GPU/NPU)、存储芯片(HBM)、光模块(800G)
  • 中游:数据中心(云端算力)、边缘服务器(近端算力)
  • 下游:AI大模型训练、工业互联网、智慧城市等场景应用

当前全球算力竞争已进入白热化阶段。训练GPT-4需数万个英伟达A100 GPU协同工作,单次训练成本超千万美元,这凸显了算力在AI时代的战略价值。


二、NPU:专为AI而生的“智能引擎”

2.1 NPU的强项

区别于通用处理器CPU和图形处理器GPU,NPU通过三大革新实现AI加速:

  1. 张量计算单元:华为昇腾910B的达芬奇架构包含512个AI Core,单个核心可在1周期内完成16x16矩阵的INT8乘加运算
  2. 存算一体设计:特斯拉Dojo芯片采用近内存计算,数据搬运能耗降低70%
  3. 动态精度切换:安谋科技X2 NPU支持INT4/INT8混合精度,图像分类任务精度损失仅0.3%

2.2 应用场景

  • 移动终端:iPhone 15的NPU实现离线运行蒸馏大模型,响应速度快过云端
  • 自动驾驶:地平线征程5 NPU支持BEV感知模型,128 TOPS算力下时延低于30ms
  • 工业质检:全志科技NPU集成专用ISP模块,3ms完成PCB缺陷检测,误检率0.01%

三、边缘计算:算力下沉的“神经末梢”

3.1 边缘计算的优势

边缘计算将算力部署在数据产生地(如摄像头、传感器),其价值体现在:

  • 时延降低90%:自动驾驶需50ms内完成障碍物识别,云端方案无法满足
  • 带宽节省60%:智能摄像头通过边缘NPU过滤无效视频帧,仅上传关键数据
  • 隐私保护升级:医疗影像在本地完成特征提取,原始数据无需外传

3.2 应用场景

场景技术方案性能指标
智能工厂NPU+边缘服务器实时监控设备状态故障预测准确率>95%
智慧城市路侧单元(RSU)搭载NPU分析车流交通拥堵降低40%
AR眼镜芯原NPU+GPU异构计算SLAM算法响应延迟<10ms

四、 NPU与边缘计算

目前看,NPU嵌入边缘设备的案例较多,就比如我们正在做的,它会产生两大质变效应:

  1. 能效革命:瑞芯微NPU在智能摄像头中功耗仅1.5W,支持实时视频结构化分析
  2. 模型轻量化:Arm Ethos-U85 NPU运行TinyLlama2模型,智能手表实现离线故事生成

它们的协同,会让你不可思议,小小的一个边缘设备,居然有这么大的能力。科技总是会让你在不经意间慨叹自己是不是被时代抛弃了。


写在后面

2025年刚过几个月,科技界就有着翻天覆地的变化。我深切感受到未来已来。
以后,算力是不是会成为像水电煤气一样的公共资源?每个月只需支付很小的成本就能够享受到计算资源带来的好处?
畅想未来,当光子NPU以光速处理数据、量子算力破解蛋白质折叠密码、边缘设备自主形成决策网络时,人类将见证一个真正泛在智能的时代。这场革命不仅关乎技术迭代,更预示着文明形态的升维——当算力如水般渗透每个角落,智能终将成为人类认知世界的第六感。

相关文章:

  • 应用层之网络应用模型,HTTP/HTTPS协议
  • ChatGPT、DeepSeek、Grok:AI 语言模型的差异与应用场景分析
  • 图神经网络学习笔记—纯 PyTorch 中的多 GPU 训练(专题十二)
  • (七)Spring Boot学习——Redis使用
  • 安卓编译问题
  • 人工智能之数学基础:如何将线性变换转换为矩阵?
  • BUG 详解 [软件测试]
  • Celery在Django中的作用
  • 【Python+HTTP接口】POST请求不同请求头构造
  • Certbot实现SSL免费证书自动续签(CentOS 7版 + Docker部署的nginx)
  • 【MySQL篇】基本查询实战OJ
  • [Hello-CTF]RCE-Labs超详细WP-Level13Level14(PHP下的0/1构造RCE命令简单的字数限制RCE)
  • python爬虫Scrapy(5)之CrawlSpider
  • vscode--工作区和相对路径
  • Nginx静态资源访问设置
  • PyTorch系列教程:高效保存和加载PyTorch模型
  • Redis中常见的问题
  • 蓝牙基础知识学习补充
  • 前端工程化之前端工程化详解 包管理工具
  • 深度学习多模态人脸情绪识别:从理论到实践
  • 气候多米诺:厄尔尼诺与东南亚跨境害虫或威胁中国粮食安全
  • SIFF动画单元公布首批片单:《燃比娃》《凡尔赛玫瑰》等
  • 第12届警博会在即:一批便民利企装备亮相,规模创历史新高
  • 我国7名优秀护理工作者荣获第50届南丁格尔奖
  • 《单身情歌》制作人韩贤光去世,林志炫发文悼念
  • 署名文章:从宏观调控看中国经济基本面