当前位置：首页 > news >正文

【TVM 教程】microTVM PyTorch 教程

news 2025/10/31 11:39:36

Apache TVM 是一个深度的深度学习编译框架，适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 →https://tvm.hyper.ai/

作者：Mehrdad Hessar

该教程展示了如何使用 PyTorch 模型进行 microTVM 主机驱动的 AOT 编译。此教程可以在使用 C 运行时（CRT）的 x86 CPU 上执行。

注意：此教程仅在使用 CRT 的 x86 CPU 上运行，不支持在 Zephyr 上运行，因为该模型不适用于我们当前支持的 Zephyr 单板。

安装 microTVM Python 依赖项

TVM 不包含用于 Python 串行通信包，因此在使用 microTVM 之前我们必须先安装一个。我们还需要TFLite来加载模型。

pip install pyserial==3.5 tflite==2.1

import pathlib
import torch
import torchvision
from torchvision import transforms
import numpy as np
from PIL import Imageimport tvm
from tvm import relay
from tvm.contrib.download import download_testdata
from tvm.relay.backend import Executor
import tvm.micro.testing

加载预训练 PyTorch 模型

首先，从 torchvision 中加载预训练的 MobileNetV2 模型。然后，下载一张猫的图像并进行预处理，以便用作模型的输入。

model = torchvision.models.quantization.mobilenet_v2(weights="DEFAULT", quantize=True)
model = model.eval()input_shape = [1, 3, 224, 224]
input_data = torch.randn(input_shape)
scripted_model = torch.jit.trace(model, input_data).eval()img_url = "https://github.com/dmlc/mxnet.js/blob/main/data/cat.png?raw=true"
img_path = download_testdata(img_url, "cat.png", module="data")
img = Image.open(img_path).resize((224, 224))# 预处理图片并转换为张量
my_preprocess = transforms.Compose([transforms.Resize(256),transforms.CenterCrop(224),transforms.ToTensor(),transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),]
)
img = my_preprocess(img)
img = np.expand_dims(img, 0)input_name = "input0"
shape_list = [(input_name, input_shape)]
relay_mod, params = relay.frontend.from_pytorch(scripted_model, shape_list)

输出：

/venv/apache-tvm-py3.8/lib/python3.8/site-packages/torch/ao/quantization/utils.py:310: UserWarning: must run observer before calling calculate_qparams. Returning default values.warnings.warn(
Downloading: "https://download.pytorch.org/models/quantized/mobilenet_v2_qnnpack_37f702c5.pth" to /workspace/.cache/torch/hub/checkpoints/mobilenet_v2_qnnpack_37f702c5.pth0%|          | 0.00/3.42M [00:00<?, ?B/s]61%|######    | 2.09M/3.42M [00:00<00:00, 11.6MB/s]
100%|##########| 3.42M/3.42M [00:00<00:00, 18.5MB/s]
/venv/apache-tvm-py3.8/lib/python3.8/site-packages/torch/_utils.py:314: UserWarning: TypedStorage is deprecated. It will be removed in the future and UntypedStorage will be the only storage class. This should only matter to you if you are using storages directly.  To access UntypedStorage directly, use tensor.untyped_storage() instead of tensor.storage()device=storage.device,
/workspace/python/tvm/relay/frontend/pytorch_utils.py:47: DeprecationWarning: distutils Version classes are deprecated. Use packaging.version instead.return LooseVersion(torch_ver) > ver
/venv/apache-tvm-py3.8/lib/python3.8/site-packages/setuptools/_distutils/version.py:346: DeprecationWarning: distutils Version classes are deprecated. Use packaging.version instead.other = LooseVersion(other)

定义目标、运行时与执行器

在本教程中，我们使用 AOT 主机驱动执行器。为了在 x86 机器上对嵌入式模拟环境编译模型，我们使用 C 运行时（CRT），并使用主机微型目标。使用该设置，TVM 为 C 运行时编译可以在 x86 CPU 机器上运行的模型，可以在物理微控制器上运行的相同流程。CRT 使用 src/runtime/crt/host/main.cc 中的 main()。要使用物理硬件，请将 board 替换为另一个物理微型目标，例如 nrf5340dk_nrf5340_cpuapp 或 mps2_an521，并将平台类型更改为 Zephyr。在《为 Arduino 上的 microTVM 训练视觉模型》和《microTVM TFLite 教程》中，可以看到更多目标示例。

target = tvm.micro.testing.get_target(platform="crt", board=None)# 使用 C 运行时 (crt) 并通过设置 system-lib 为 True 打开静态链接
runtime = tvm.relay.backend.Runtime("crt", {"system-lib": True})# 使用 AOT 执行器代替图或 vm 执行器。不要使用未包装的 API 或 C 风格调用
executor = Executor("aot")

编译模型

现在为目标编译模型：

with tvm.transform.PassContext(opt_level=3,config={"tir.disable_vectorize": True},
):module = tvm.relay.build(relay_mod, target=target, runtime=runtime, executor=executor, params=params)

创建 microTVM 项目

现在，我们已经将编译好的模型作为 IRModule 准备好，我们还需要创建一个固件项目，以便在 microTVM 中使用编译好的模型。为此，我们需要使用 Project API。

template_project_path = pathlib.Path(tvm.micro.get_microtvm_template_projects("crt"))
project_options = {"verbose": False, "workspace_size_bytes": 6 * 1024 * 1024}temp_dir = tvm.contrib.utils.tempdir() / "project"
project = tvm.micro.generate_project(str(template_project_path),module,temp_dir,project_options,
)

构建、烧录和执行模型

接下来，我们构建 microTVM项目并进行烧录。烧录步骤特定于物理微控制器，如果通过主机的 main.cc 模拟微控制器，或者选择 Zephyr 模拟单板作为目标，则会跳过该步骤。

project.build()
project.flash()input_data = {input_name: tvm.nd.array(img.astype("float32"))}
with tvm.micro.Session(project.transport()) as session:aot_executor = tvm.runtime.executor.aot_executor.AotModule(session.create_aot_executor())aot_executor.set_input(**input_data)aot_executor.run()result = aot_executor.get_output(0).numpy()

查询 Synset 名称

查询在 1000 个类别 Synset 中的 top-1 的预测。

synset_url = ("https://raw.githubusercontent.com/Cadene/""pretrained-models.pytorch/master/data/""imagenet_synsets.txt"
)
synset_name = "imagenet_synsets.txt"
synset_path = download_testdata(synset_url, synset_name, module="data")
with open(synset_path) as f:synsets = f.readlines()synsets = [x.strip() for x in synsets]
splits = [line.split(" ") for line in synsets]
key_to_classname = {spl[0]: " ".join(spl[1:]) for spl in splits}class_url = ("https://raw.githubusercontent.com/Cadene/""pretrained-models.pytorch/master/data/""imagenet_classes.txt"
)
class_path = download_testdata(class_url, "imagenet_classes.txt", module="data")
with open(class_path) as f:class_id_to_key = f.readlines()class_id_to_key = [x.strip() for x in class_id_to_key]# Get top-1 result for TVM
top1_tvm = np.argmax(result)
tvm_class_key = class_id_to_key[top1_tvm]# Convert input to PyTorch variable and get PyTorch result for comparison
with torch.no_grad():torch_img = torch.from_numpy(img)output = model(torch_img)# Get top-1 result for PyTorchtop1_torch = np.argmax(output.numpy())torch_class_key = class_id_to_key[top1_torch]print("Relay top-1 id: {}, class name: {}".format(top1_tvm, key_to_classname[tvm_class_key]))
print("Torch top-1 id: {}, class name: {}".format(top1_torch, key_to_classname[torch_class_key]))

输出结果：

Relay top-1 id: 282, class name: tiger cat
Torch top-1 id: 282, class name: tiger cat

该脚本总运行时间：（1分26.552秒）

下载 Python 源代码：micro_pytorch.py

下载 Jupyter notebook：micro_pytorch.ipynb

查看全文

http://www.dtcms.com/a/186288.html

@Component 注解：Spring 组件扫描与管理的基石

istringstream的简化源码详解

django之视图

构建DEEPPOLAR ——Architecture for DEEPPOLAR (256,37)

一文读懂如何使用MCP创建服务器

LWIP传输层协议笔记

C++ asio网络编程(5)简单异步echo服务器

【】东方财务的Choice数据量化接口，在linux上安装python 版本，需要联系客户经理审核通过后就可以使用了。使用接口更加稳定和全面。

智能指针入门：深入理解 C++ 的 shared_ptr

【Mysql基础】一、基础入门和常见SQL语句

Matlab自学笔记五十四：符号数学工具箱和符号运算、符号求解、绘图

LLaMA Factory 深度调参

右值和移动

国产化Excel处理控件Spire.XLS系列教程：如何通过 C# 删除 Excel 工作表中的筛选器

开疆智能Profinet转Canopen网关连接sick RFID读写器配置案例

212. 单词搜索 II【力扣(LeetCode) 】

RDB和AOF的区别

Kubernetes vs. OpenShift：深入比较与架构解析

Java学习手册：客户端负载均衡

Matlab 模糊pid的液压舵机伺服系统

基于微信小程序的城市特色旅游推荐应用的设计与实现

Milvus 2.4 使用详解：从零构建向量数据库并实现搜索功能（Python 实战）

记一次redis未授权被种挖矿

Java中进阶并发编程

langchain4j中使用milvus向量数据库做RAG增加索引

新能源汽车电池加热技术：传统膜加热 vs. 脉冲自加热

C++类成员

【技巧】使用frpc点对点安全地内网穿透访问ollama服务

Ascend的aclgraph（五）PrimTorch TorchInductor

网页Web端无人机直播RTSP视频流，无需服务器转码，延迟300毫秒