当前位置：首页 > news >正文

Jetson Orin 安装 onnxruntime

news 2025/10/10 4:31:09

Jetson Orin 安装 onnxruntime

onnxruntime在Jetson上安装只需注意三件事： 版本！ 版本！ 还是TMD版本！

本机环境

Jectpack : 5.1.2
CUDA : 11.4
cuDNN ：8.6.0

版本说明

关于onnxruntime的版本适配不同的官方有不同的推荐

英伟达jetson zoo提供了onnxruntime的预编译版本，版本号是根据Jetpack的版本号来选择onnxruntime，这里推荐的是1.17.0和1.18.0
onnxruntime官方是根据CUDA版本推荐的，这里推荐的是1.11和1.12

这里二者推荐的版本很矛盾，因此综上所述，我们选择的版本是1.16.0 😃 因为前面几个版本测试安装都有问题

1、安装准备

Jetson zoo虽然有onnxruntime的预编译版本，但是是python版本的，没有c++部署需要的头文件和动态库，所以推荐源码安装编译。
首先需要临时声明一些环境变量

sudo apt-get install protobuf-compiler libprotoc-dev
 
export PATH=/usr/local/cuda/bin:${PATH}
export CUDA_PATH=/usr/local/cuda
export cuDNN_PATH=/usr/lib/aarch64-linux-gnu
export CMAKE_ARGS="-DONNX_CUSTOM_PROTOC_EXECUTABLE=/usr/bin/protoc"

2、源码下载

源码下载，最好直接用git clone，而不是去github下载对应版本的程序，因为build.sh好像需要git的仓库，为了不必要的麻烦直接gitclone

git clone --recursive https://github.com/Microsoft/onnxruntime.git

--recursive 递归子库
切换版本号

git checkout v1.16.0

更新子仓库

git submodule update --init --recursive --progress

NOTICE1:
这一步可能会遇到如下错误
does not match expected value
expected: ‘ee201b07085203ea7bd8eb97cbcb31b07cfa3efb’
actual: ‘5b3adeb17e87b1a6f6a716b2c462f44b5aa01713’
– Hash mismatch, removing…
导致程序卡在eigen这个库反复下载
在这里插入图片描述
出现此问题的原因是git下来的eigen库哈希值与期望的哈希值不一致，即使手动下载此库也会这样。目前不清楚expected的哈希值为什么与给出链接的不同，可能是版本问题。
找到 ./onnxruntime/cmake/external路径下的eigen.cmake文件，在文件开始强制修改期望的哈希值为下载的版本，这里举例我的是

set(DEP_SHA1_eigen "5b3adeb17e87b1a6f6a716b2c462f44b5aa01713")

NOTICE2:
可能会遇到这个错误，由于丢失记不清哪个错误了，总之就会卡住一会，网络错误，多试几遍就好
ontent.cmake:2145:EVAL:2 (__FetchContent_doPopulation) /usr/local/cmake/share/cmake-3.31/Modules/FetchContent.cmake:2145 (cmake_language) /usr/local/cmake/share/cmake-3.31/Modules/FetchContent.cmake:1978:EVAL:1 (__FetchContent_Populate) /usr/local/cmake/share/cmake-3.31/Modules/FetchContent.cmake:1978 (cmake_language) external/eigen.cmake:12 (FetchContent_Populate) external/onnxruntime_external_deps.cmake:483 (include) CMakeLists.txt:586 (include) -

3、编译

cd ./onnnxruntime
./build.sh --config Release --update --build --parallel --build_shared_lib --build_wheel --use_cuda --cuda_home /usr/local/cuda --cudnn_home /usr/lib/aarch64-linux-gnu

--build_shared_lib生成动态库 --use_cuda使用cuda --parallel多线程编译

编译完成标志

...
build [INFO] - Build complete

在这里插入图片描述

4、安装

cd ./build/Linux/Release
sudo make install

在这里插入图片描述
安装完成后动态库 libonnxruntime.so 在/usr/local/lib里
头文件在/usr/local/include/onnxruntime里

5、异常分析

ImportError: cannot import name ‘FileError’ from ‘setuptools.errors’

遇到这个问题可能是setuptools版本问题，检查更新并安装依赖库
```
python3 -m venv onnxruntime-env
source onnxruntime-env/bin/activate
pip install --upgrade pip setuptools
pip install -r /mnt/cf/wk_test/onnxruntime/requirements.txt
```
然后重新编译

5、其他版本

随手记录下其他版本安装中遇到的问题，以供参考和复盘

v1.17.0 / v1.18.0
首先报错

CMake Error at CMakeLists.txt:647 (message): The compiler doesn't support BFLOAT16!!!

此报错为gcc-9版本不支持BFLOAT16类型，需要升级到gcc-10版本

然后遇到报错

error: This file was generated by an older version of protoc which is incompatible with your Protocol Buffer headers.

这个错误是在编译时源码报的错，错误表明 ‌Protocol Buffer（protoc）版本不兼容‌，导致生成的 onnx-ml.pb.h 文件与当前系统安装的 protobuf 头文件冲突，直接放弃

v1.16.3
1.16.3在编译时可以通过，但是在编译后的test测试会报错

----------] Global test environment tear-down [==========] 4119 tests from 289 test suites ran. (344132 ms total)
 [ PASSED ] 4110 tests. 
[ SKIPPED ] 6 tests, listed below: 
[ SKIPPED ] AttentionTest.AttentionPastState_dynamic [ SKIPPED ] AttentionTest.Attention_Mask2D_Fp32_B2_S32 
[ SKIPPED ] AttentionTest.Attention_Mask1D_Fp32_B2_S64 [ SKIPPED ] AttentionTest.Attention_NoMask_Fp16
 [ SKIPPED ] MatMulFpQ4.MatMul2DSym 
 [ SKIPPED ] MatMulFpQ4.MatMul2DBlkZp
 [ FAILED ] 3 tests, listed below: 
[ FAILED ] MultiHeadAttentionTest.CrossAttention_Batch2_HeadSize32_NoBias_NoMask_PackedKV 
[ FAILED ] MultiHeadAttentionTest.SelfAttention_Batch2_HeadSize32_NoBias_NoMask_PackedQKV 
[ FAILED ] QuantizeLinearOpMLFloat16Test.Float8 3
 FAILED TESTS YOU HAVE 9 DISABLED TESTS <end of output> Test time = 344.85 sec ---------------------------------------------------------- 
 Test Failed. "onnxruntime_test_all"

搜索后可能是注意力机制和量化模块有问题,解决了之后又报

packed KV format is not implemented for current GPU. Please disable packed kv in fusion options‌

此问题属于 ONNX Runtime 对特定 GPU 架构的算子支持不完整，因此放弃了此版本。

v1.12.0
编译时总是遇到 undefined reference to `libiconv_close’ 这个错误，但是已经安装了libiconv库，并且export临时声明了库的地址，试过了很多方法还是报错，放弃。

查看全文

http://www.dtcms.com/a/56206.html

Web3中的AI：一种去中心化智能的完整指南

奥运会运动员年龄规定·棒球1号位

【C++】5.6 try语句和异常处理

C# 命名空间(Namespace)详解

稀疏注意力：打破Transformer计算瓶颈，实现高效长序列建模

ES02 - ES语句

TMS320F28P550SJ9学习笔记7：结构体寄存器方式配置SCI通信收发_SCI通信收发测试

C/C++ 实现由用户通过键盘输入自然数并判断其是不是素数（带清空缓冲区等考虑）

【MySQL-数据类型】数据类型分类+数值类型+文本、二进制类型+String类型

全星FMEA软件：汽车电子行业研发管理高效之选

VPS加装前置代理全解析

uni_app实现下拉刷新

K8S学习之基础十七：k8s的蓝绿部署

AUTOSAR ETH模块（3）——接口功能分析

利用EasyCVR平台打造化工园区视频+AI智能化监控管理系统

解密 Atlassian Cloud：创新驱动的项目管理之道

STM32之I2C通信概览

什么是 spring 的循环依赖？

深入解析EfficientNet：高效深度学习网络与ResNet的对比（使用TensorFlow进行代码复现，并使用cifar10数据集进行实战）

UniApp 运行的微信小程序如何进行深度优化

服务器虚拟化：技术原理、实践与未来趋势

测试用大模型组词

文件传输协议（File Transfer Protocol, FTP）

计算机组成原理第三章存储系统

机试准备第11天

HarmonyOS ArkTS声明式UI开发实战教程

Ascend开发板镜像烧录、联网、其他设备访问

Laya中runtime的用法

显示器长时间黑屏

【音视频】ffmpeg命令提取音视频数据