当前位置: 首页 > news >正文

阿里云大模型训练与推理开发

本文主要描述阿里云大模型开发环境的搭建、训练数据集的制作流程、大模型如何训练数据集以及如何利用已训练完成的模型执行推理。

开发环境搭建

ModelScope社区是阿里云通义千问开源的大模型开发者社区。

图片

如上所示,安装ModelScope社区大模型基础库开发框架的命令行参数,使用清华大学提供的镜像地址

图片

图片

如上所示,在JetBrains PyCharm的项目工程终端控制台中,安装深度学习基础库开发框架pytorch

图片

图片

如上所示,在JetBrains PyCharm的项目工程终端控制台中,安装深度学习基础库开发框架tensorflow

图片

图片

如上所示,在JetBrains PyCharm的项目工程终端控制台中,安装ModelScope社区大模型基础库开发框架

图片

如上所示,在JetBrains PyCharm的项目工程终端控制台中,安装ModelScope社区大模型多模态领域开发框架

图片

图片

如上所示,在JetBrains PyCharm的项目工程的测试代码中,使用分词器对原文执行分析操作,输出分词列表

运行千问大模型

https://www.modelscope.cn/models/Qwen/Qwen2.5-0.5B-Instruct/files

图片

如上所示,从ModelScope社区的模型仓库下载开源的千问大模型到本地

图片

图片

如上所示,在JetBrains PyCharm的项目工程的测试代码中,加载开源的千问大模型,设置本地开发环境使用CPU设备

图片

如上所示,在JetBrains PyCharm的项目工程中运行测试代码完成

训练数据集制作

https://modelscope.cn/datasets/liucong/Chinese-DeepSeek-R1-Distill-data-110k/files

图片

如上所示,从ModelScope社区下载数据集

图片

如上所示,下载的数据集是文本格式,该数据集是用于监督型机器学习,可以将该数据集按照8:2的比例分成两个数据集,分别用于训练数据集以及测试评估数据集,也可以从整体数据集中随机抽取数据记录用于训练数据集以及测试评估数据集,或者根据实际的业务数据制作训练数据集以及测试评估数据集

图片

如上所示,数据集的字段属性说明,输入的字段是提供给机器学习的输入,思考的字段是输出的强相关内容,输出的字段相当于监督型机器学习的分类输出

模型训练

图片

如上所示,ModelScope社区是使用人工智能机器学习开源框架PyTorch,训练器包括训练过程以及评估过程,训练过程中经过多次迭代,不断优化参数,最终输出合适的参数,评估过程中经过多次迭代,最终输出评估的分数

图片

如上所示,使用ModelScope社区的人工智能机器学习框架加载训练数据集以及测试评估数据集

图片

如上所示,ModelScope社区的人工智能机器学习训练器的属性配置

图片

如上所示,使用ModelScope社区的人工智能机器学习训练器执行数据训练

图片

如上所示,使用ModelScope社区的人工智能机器学习训练器执行测试评估,以及保存训练完成的模型到指定的目录中

模型推理

图片

如上所示,使用ModelScope社区的人工智能推理框架pipeline,对已完成训练的大模型执行推理

图片

https://www.modelscope.cn/docs/sdk/pipelines

如上所示,ModelScope社区提供的pipeline推理框架支持的部分任务列表


相关文章:

  • 关于点卷积
  • 利用Ollama对AI大模型进行攻击
  • vue3 处理文字 根据文字单独添加class
  • MySQL基础 [五] - 表的增删查改
  • 进程状态(运行 阻塞 僵尸)及其场景分析
  • 智谛达多功能人形机器人:未来生活的得力助手
  • DMA 概念与讲解
  • LeetCode 热题 100_完全平方数(84_279_中等_C++)(动态规划(完全背包))
  • 随机产生4位随机码(java)
  • 设计模式之享元模式
  • 图解AUTOSAR_SWS_FlexRayDriver
  • 使用分布式锁和乐观锁解决超卖问题
  • 闪蒸高密度聚乙烯无纺布市场报告:探索高性能材料的新机遇
  • 搜广推面经六十八
  • yum拒绝连接
  • 【区块链+ 人才服务】蓝鲸智课——区块链课程与实训平台 | FISCO BCOS 应用案例
  • GS069W电动工具直流调速电路:高效调速方案解析
  • 【多线程-第四天-自己模拟SDWebImage的下载图片功能-取消操作 Objective-C语言】
  • Quartz 分布式集群 数据持久化任务调度系统
  • 【VScode】C/C++使用教程
  • 网站建设招标书模板/杭州seo关键字优化
  • 郑州网站建设最独特/seo关键词排名优化费用
  • 昆山高端网站建设机构/艾滋病阻断药有哪些
  • 微信社群营销怎么做/seo流量是什么意思
  • app产品网站建设/二级域名网站查询入口
  • 网站建设中什么意思/服务营销理论