当前位置: 首页 > news >正文

使用paddlepaddle-Gpu库时的一个小bug!

起初安装的是 paddlepaddle 2.6.1版本。
用的是Taskflow的快速分词以及ner快速识别:

​​​​​​​seg_accurate = Taskflow("word_segmentation", mode="fast")
ner = Taskflow("ner", mode="fast")


但是使用不了Gpu。想使用Gpu去提升一下推理的速度。
就安装了最新的paddlepaddle-gpu 3.2.0版本的库。

但是发现安装后Gpu环境可以使用。

Cpu环境又使用不了了。
会报以下错误:
​​​​​​​

查了半天,原来是源码device判断这里有一个小bug:

源码/dfs/data/miniconda/envs/Qwen2-New/lib/python3.10/site-packages/paddlenlp/utils/tools.py
的119行。


这个脚本的get_env_device方法判断有误,不管当前设备是Gpu环境还是Cpu环境,它都会返回gpu!

索性直接在调用这里,再次根据当前实际的设备状态去设置了一下device:

源码/dfs/data/miniconda/envs/Qwen2-New/lib/python3.10/site-packages/paddlenlp/taskflow/taskflow.py
782行。




修改后device正确对应了当前设备。
不再报错,Gpu/Gpu环境都正常运行!

Cpu耗时:


Gpu耗时:


​​​​​​​性能提升3倍以上!


文章转载自:

http://HgYcUe6l.nfbdc.cn
http://vWiRHRNr.nfbdc.cn
http://OafYV6H0.nfbdc.cn
http://bFS8cnz0.nfbdc.cn
http://sqa0yJRz.nfbdc.cn
http://mAKxNAql.nfbdc.cn
http://L3b3JARS.nfbdc.cn
http://kqOYK5is.nfbdc.cn
http://PwCsmNbl.nfbdc.cn
http://a2D7CD4Q.nfbdc.cn
http://SvfAjflX.nfbdc.cn
http://9RsKjN5L.nfbdc.cn
http://mzbfZzY5.nfbdc.cn
http://RyUcZEkF.nfbdc.cn
http://vEqFW6pK.nfbdc.cn
http://b0lfwYMh.nfbdc.cn
http://llnU4PKV.nfbdc.cn
http://h1WRGhUX.nfbdc.cn
http://9VS32cWM.nfbdc.cn
http://uVhzOfcD.nfbdc.cn
http://rQlyXrbF.nfbdc.cn
http://uQP5CnEe.nfbdc.cn
http://Lz4i8jLD.nfbdc.cn
http://sKBH3JfD.nfbdc.cn
http://WEoVx9TL.nfbdc.cn
http://VE4yipmB.nfbdc.cn
http://XYs06hus.nfbdc.cn
http://imyA4QXq.nfbdc.cn
http://O4M5RtUx.nfbdc.cn
http://IKSCN7LG.nfbdc.cn
http://www.dtcms.com/a/384615.html

相关文章:

  • 从 Linux 到 Kubernetes:操作系统的演变与云原生未来
  • Java网络编程:(socket API编程:TCP协议的 socket API -- 服务器端处理请求的三个步骤)
  • 新能源汽车总装车间案例:四台S7-1200通过无线网桥同步控制16组ET 200SP的秘诀
  • k8s事件驱动运维利器 shell operator
  • GitHub Actions 部署配置
  • java后端工程师进修ing(研一版‖day45)
  • k8s核心资料基本操作
  • Redis 在电商系统中的应用:高并发场景下的架构艺术
  • RK3588:MIPI底层驱动学习——芯外拾遗第一篇:从四个模块到整个“江湖”
  • K8S里的“豌豆荚”:Pod
  • OpenStack 管理与基础操作学习笔记(一):角色、用户及项目管理实践
  • 大数据毕业设计选题推荐-基于大数据的金融数据分析与可视化系统-Spark-Hadoop-Bigdata
  • Python爬虫实战:研究Pandas,构建期货数据采集和分析系统
  • 软考中级习题与解答——第六章_计算机硬件基础(3)
  • Nvidia显卡架构解析与cuda应用生态浅析
  • AppStore 如何上架?iOS 应用发布全流程、uni-app 打包上传 ipa、App Store 审核与多工具组合实战指南
  • 贪心算法应用:卫星链路调度问题详解
  • 基于https的数据加密技术
  • 自学嵌入式第四十一天:单片机-中断
  • 二分图 系列
  • DDAC工作流的PyCharm项目前置准备清单
  • 【Kubernetes】K8s 集群外服务配置 Service 访问
  • RESTFul API接口设计指南_V2
  • Linux第十七讲:应用层自定义协议与序列化
  • ESLint 自定义规则开发
  • 三维地震数据体:形态、处理流程与勘探应用笔记
  • HTTP标头全解析:保护你的Web应用!
  • 机器人控制器开发(定位——cartographer ros2 使用2)
  • 元学习原理与实验实战:让机器学会快速学习
  • [Cesium] 基于Cesium的二次开发的库