当前位置: 首页 > wzjs >正文

找网站建设沧州百度推广总代理

找网站建设,沧州百度推广总代理,商家网站建设模板,超变变态版传奇TPU-MLIR——实现Chatglm2-6B大模型移植部署 本项目实现BM1684X部署语言大模型ChatGLM2-6B。通过TPU-MLIR编译器将模型转换成bmodel,并采用c代码将其部署到BM1684X的PCIE环境,或者SoC环境。 编译chatglm2-6B模型 1. 下载‘Chat-GLM2-6B’ 2. 对该模型…

TPU-MLIR——实现Chatglm2-6B大模型移植部署

本项目实现BM1684X部署语言大模型ChatGLM2-6B。通过TPU-MLIR编译器将模型转换成bmodel,并采用c++代码将其部署到BM1684X的PCIE环境,或者SoC环境。

编译chatglm2-6B模型

1. 下载‘Chat-GLM2-6B’

在这里插入图片描述

2. 对该模型做两点修改:

一是将config.json文件中seq_length配置为512;
二是将modeling_chatglm.py文件中的如下代码:在这里插入图片描述

修改为:
在这里插入图片描述

这样修改可以提升效率,使用masked_fill效率低下

加载并编译TPU-MLIR:
在这里插入图片描述

下载本项目‘ChatGLM2-TPU’
在这里插入图片描述

编译模型
  1. 指定’ChatGLM2-6B‘的python路径
    在这里插入图片描述

  2. 导出所有onnx模型,如果过程中提示缺少某些组建,直接’pip install‘即可
    在这里插入图片描述

  3. 对onnx模型进行编译,生成bmodel,这个过程会花一些时间,最终生成’chatglm2-6b.bmodel’文件
    在这里插入图片描述

移植模型到开发板
  1. chatglm2-6b.bmodeltokenizer.model拷贝到开发板运行环境。(tokenizer.model来自ChatGLM2-6B)
    在这里插入图片描述

C++部署测试(1684X开发板)

编译模型
  1. 将sentencepiece编译后/workspace/sentencepiece/build/src/目录下SoC版本的libsentencepiece.a替换到此目录的/lib/下,进入chatglm2-tpu/demo目录进行编译

    在这里插入图片描述
    在这里插入图片描述

    如果要编译SoC环境,则修改CMakeLists.txt为以下内容:【 CMakeLists.txt在上一级目录 】
    在这里插入图片描述

  2. 编译
    在这里插入图片描述

  3. 将ChatGLM2-TPU整个目录拷贝到开发板运行环境就可以执行了。
    在这里插入图片描述

连接开发板

通过本地网络适配器网线直连方式,IP地址:192.168.150.1,用户名:linaro 密码:linaro
在这里插入图片描述

也可通过串口Serial连接,设置COM口,Speed为115200
成功进入显示linaro@bm1684的Ubuntu系统
通过LAN口网络连接方式,IP地址:172.xxx.xxx.xxx(DHCP获取的地址,可通过串口ifconfig查看IP),用户名:linaro 密码:linaro

开发板运行

进入到/data/目录,查看scp传输的文件:
在这里插入图片描述

执行编译好的C++代码,即可实现在线chat
在这里插入图片描述

c++部署完成!

python部署测试(1684x开发板)

编译模型
  1. 进入chatglm2-tpu/python_demo目录进行编译
    在这里插入图片描述

    如果要编译SoC环境,则修改CMakeLists.txt为以下内容:【 CMakeLists.txt在上一级目录 】
    在这里插入图片描述

  2. 编译
    在这里插入图片描述

    编译成功会生成ChatGLM2.cpython-38-x86_64-linux-gnu.so,之后将chatglm2-6b.bmodel放到python_demo目录下。

  3. 将ChatGLM2-TPU整个目录拷贝到开发板运行环境就可以执行了。
    在这里插入图片描述

连接开发板

通过本地网络适配器网线直连方式,IP地址:192.168.150.1,用户名:linaro 密码:linaro
在这里插入图片描述

也可通过串口Serial连接,设置COM口,Speed为115200
成功进入显示linaro@bm1684的Ubuntu系统
通过LAN口网络连接方式,IP地址:172.xxx.xxx.xxx(DHCP获取的地址,可通过串口ifconfig查看IP),用户名:linaro 密码:linaro

开发板运行

进入到/data/目录,查看scp传输的文件:
在这里插入图片描述

运行
在这里插入图片描述

python部署完成!

http://www.dtcms.com/wzjs/104727.html

相关文章:

  • 国家住房和城乡建设部网站吧长沙网站优化效果
  • WordPress古腾堡插件seo黑帽技术有哪些
  • 泉州住房和城乡建设部网站湖南竞价优化专业公司
  • 华资源网站建设白酒最有效的推广方式
  • 网站上传ftp品牌网站建设哪家好
  • 租用空间做网站河南seo和网络推广
  • 保定网站制作排名需要多少钱如何写好软文推广
  • 网站多语言 设计看网站搜什么关键词
  • 不用登录的游戏站长工具seo排名
  • 成立一个做网站的公司成本爱站网关键词挖掘机
  • 合肥网站制作联系方式常用的网络推广的方法有哪些
  • 国外域名注册网站网络运营推广怎么做
  • 纺织网站建设方案百度收录网站要多久
  • 上海网站建设设计公司seo顾问公司
  • 在线音乐网站 用什么做西安百度提升优化
  • php网站语言切换功能如何做万网注册域名查询
  • 做网站有什么好书籍抖音seo优化软件
  • 有没有专门做帽子的网站产品营销推广策略
  • 淘宝上面建设网站安全么公司网站制作
  • 如何拿qq空间做网站拓客引流推广
  • 海外营销网站建设百度网站怎么提升排名
  • 网站建设资料清单网络营销概述ppt
  • 建站公司专业团队优化大师电视版
  • 交友网站该如何做seo培训机构哪家好
  • 网站建设销售要懂什么百度竞价推广是什么
  • 建微网站有什么好处软文广告
  • 微网站制作工具整站优化报价
  • 江苏省建设厅官方网站公式公告网球排名即时最新排名
  • 电子商务 网站建设杭州seo服务公司
  • 做网站的客户需求百度百家号