当前位置: 首页 > news >正文

端侧推理软件栈

目前单个嵌入式设备算力不足以训练模型,运行大语言模型进行推理算力也是很吃紧的。嵌入式设备上可以部署轻量模型推理软件栈。

如何构建嵌入式设备模型软件栈:

1、构建自己的模型文件格式。

2、构建python,c接口库,提供模型构建工具集,模型推理接口库等。

3、支持TensorFlow,PyTorch,ONNX等模型,并提供工具将这些模型转换成自己的模型,而且提供工具分析自己的模型。

4、提供模型评估工具,支持精度评估,性能评估,内存评估等。

5、支持推理,量化,稀疏,矩阵运算,自定义算子,动态shape,数据排布等特性和功能,支持NPU/GPU/CPU调度,Cache管理等硬件管理,支持图级别/算子级别/内存优化等优化机制和流程。

6、算子可以运行在CPU上(可用SVE,NEON指令扩展等优化性能),可以运行在GPU,NPU,TPU上,其中TPU是谷歌自研的。

7、端侧使用GPU运行算子可以用OpenGL,OpenCL,Vulkan等库,MNN,NCNN是对这些库进行了封装。在NPU上运行算子需要使用专用的NPU软件栈,ARM的NPU软件栈是ARM NN。

http://www.dtcms.com/a/282295.html

相关文章:

  • 搜索框的显示与隐藏(展开与收起)
  • 智能工厂生产设备状态检测算法
  • Navicat Premium17.2.8 下载与安装(免费版)
  • 数字万用表是什么?七位半数字万用表/多用表的核心指标应用及技术趋势?
  • 近期学习总结
  • ADS8331手册驱动开发
  • HTML基础知识 二(创建容器和表格)
  • 达梦数据库CASE_SENSITIVE大小写敏感差异比较
  • HTB cap wp
  • 0 - MIT 6.S081 2020 操作系统 实验环境配置
  • 前端性能与可靠性工程:前端韧性工程 - 优雅降级与离线支持
  • Nginx,MD5和Knife4j
  • 使用TIANAI-CAPTCHA进行行为验证码的生成和缓存的二次校验
  • 【后端】.NET Core API框架搭建(6) --配置使用MongoDB
  • 随机链表的复制数据结构oj题(力口138)
  • 数据结构--准备知识
  • 随机链表的复制数据结构oj题(CM11)
  • SOTI MobiControl vs EasyControl:MDM 解决方案对比 —— 理解差异与价值
  • batchnorm1d,layernorm,revin区别
  • 关于程序=数据结构+算法这句话最近的一些思考
  • 【数据结构】「栈」(顺序栈、共享栈、链栈)
  • iOS 抓包工具选择与配置指南 从零基础到高效调试的完整流程
  • 时序大模型为时序数据库带来的变革与机遇
  • Flutter 记录 使用ModalRoute获取参数
  • flutter app内跳转到其他安卓 app的方法
  • qt udp接收时 丢包
  • 安卓开发使用Android Studio配置flutter环境
  • 《Qt信号与槽机制》详解:从基础到实践
  • Flutter运行Android项目时显示java版本不兼容(Unsupported class file major version 65)的处理
  • 《Qt实战开发》:从计算器到音乐播放器的全栈实现指南