当前位置: 首页 > news >正文

NVIDIA Jetson Nano的国产替代,基于算能BM1684X+FPGA+AI算力盒子,支持deepseek边缘部署

NVIDIA Jetson Nano的国产替代,基于算能BM1684X的AI算力盒子,支持deepseek边缘部署

另外,还提供BM1684X+FPGA+AI的解决方案。

图片

核心板基于Sophon SG2300X SoC(也叫BM1684X)打造

图片

带有8核ARM Cortex-A53 @2.3GHz,频率很高。

图片

带有TPU(张量处理器)

算力可达32TOPS@int816TFLOPS(FP16/BF16)

和2TFLOPS(FP32)

支持TensorFlow、Caffe、PyTorch、Paddle、ONNX、MXNet、Tengine、DarkNet等深度学习框架。

图片

视频处理单元(VPU)支持32路H.265/H.264 1080P@25fps解码12路编码

图片

JPEG编解码支持1080P@600fps,最大分辨率32768×32768,后处理功能涵盖图像缩放、裁剪、色彩空间转换等。

搭配16GB LPDDR4X内存,看芯片框图,似乎是四个4GB内存芯片,可能是四通道,这样的话,速度应该还可以。

图片

64GB eMMC 5.1,16MB SPI Flash

核心板通过144P的板对板连接器安装到扩展板上,引出了不少接口。
扩展板带有M.2 E Key(用于安装Wi-Fi/BT)、M.2 2230 NVMe SSD
外面有两个USB3.0 HOST接口,两个千兆网口

图片

一个USB Type-C电源接口支持PD供电,电压支持20V输入,支持20V3.25A或者更高,也就是支持65W以上的电源。

一个USB Type-C Debug UART接口,MicroSD卡槽。

工作温度0~40℃。

尺寸104×84×52mm

系统上,官方提供了两个镜像,一个是基础镜像,基于Ubuntu Server 20.04,仅包含 Sophon 基础 SDK 和后台,只有1.2GB。

还有一个基于Ubuntu Server 20.04,包含Sophon SDK和后台,预装瑞莎LLM前端,预装CasaOS,常见LLM的Demo的完整版镜像,大小来到了9.5GB。

图片

而这个AirBox的亮点也就在于预装了CasaOS,极大的的简化了部署大模型的门槛,部署各类大模型都相当轻松

图片

官方完整版镜像默认预装了Stable Diffusion

部署whisper,chatglm2 chatdoc chatbot

imagesearch,llama3也非常轻松,只需要简单几步就部署完成了,搞这些在Linux下变得轻松愉快。

你也可以自己打包Docker镜像,官方也有教程可以参考,这样之后部署这些都会变得相当简单。

而重头戏其实是本地部署LLM大语言模型,可以部署

chatglm2 chatdoc chatbot

图片

Llama3,Qwen2,DeepSeek R1
官方介绍了deepseek-r1-distill-qwen-1.5b和deepseek-r1-distill-qwen-7b两个Qwen2.5蒸馏模型的部署。

都采用的INT4量化方式,目前1.5B的模型,在AirBox上,推理速度可达30.448tokens/s7B的模型,推理速度可达11.008tokens/s

图片

Llama3 8B模型推理速度可达9.566token/s

图片

文生图大模型支持Stable Diffusion1.5Real ESRGAN,Stable Diffusion 3 Medium,FLUX.1这些模型的部署,且都能正常运行。
在Stable Diffusion1.5下生成一个512x512的图片,在7秒左右。

图片

除此之外还支持Image Search文本搜索图片Video Search文本搜索视频,向量搜索模型应用。

图片

支持Emoti VoiceWhisper这些TTS/STT模型的部署。还有MiniCPM-V2.6这个视觉多模态模型。

想要更多模型,Radxa也准备了Model-Zoo,可以部署目标检测,语义分割,人脸检测各种算法应用。

图片

Radxa还提供了TPU-MLIR编译器工具链,用于将各种不同框架下预训练的神经网络模型转化为可以在算能TPU上运行的bmodel格式模型。

可以直接支持PyTorch, ONNX, Caffe 和 TFLite。其他框架的模型需要转换为ONNX模型。

转换完之后,Radxa还提供了TPU-PERF用于TPU加载/推理经过TPU-MLIR转换好的bmodel模型

图片

相关文章:

  • 【Python项目】基于深度学习的电影评论情感分析系统
  • 机械臂路径规划方法综述(一)
  • 机器学习中的线性代数:奇异值分解 SVD
  • 汇编点亮LED
  • python文本处理openpyxl库安装与使用
  • 江科大51单片机笔记【9】DS1302时钟可调时钟(下)
  • 【五.LangChain技术与应用】【25.LangChain RAG检索器与完整案例:实战中的RAG应用】
  • Mac同时安装jdk8和jdk17,默认选择jdk8
  • 计算机组成与系统结构—袁春风阅读笔记(一)
  • 博查搜索API日调用量突破3000万次,达到Bing API的1/3。
  • 论文粗读——Isometric 3D Adversarial Examples in the Physical World
  • 【CSS】---- 纯 CSS 实现无限滚动轮播
  • Linux下AWK命令使用方法
  • JavaScript中的Math()
  • SpringBoot优雅关机,监听关机事件,docker配置
  • gbase8s数据库检测非法字符
  • VSCode 配置优化指南:打造高效的 uni-app、Vue2/3、JS/TS 开发环境
  • JS—组成:2分钟掌握什么是ECMAScript操作,什么是DOM操作,什么是BOM操作
  • 在Blender中给SP分纹理组
  • GStreamer —— 2.6、Windows下Qt加载GStreamer库后运行 - “教程6:媒体格式和Pad功能“(附:完整源码)
  • wordpress定制主题/广州百度seo代理
  • 最好的网站管理系统/中国万网
  • wordpress建一个网站/怎样在百度上注册自己的店铺
  • 西宁电子商务网站建设/广州seo顾问
  • 网站建设用什么程序语言/网络推广公司收费标准
  • 网站建设发票内容/考研培训班哪个机构比较好