当前位置：首页 > news >正文

【Datawhale25年9月组队学习：llm-preview+Task1：大模型介绍与环境配置】

news 2025/9/18 7:11:37

1.大模型与传统NLP模型（如BERT）的不同点
最大的区别在于使用范式的改变：
BERT：像一个大学毕业生，基础不错（经过了预训练），但要胜任某个具体工作（比如情感分析），还需要岗前培训（用情感分析的数据集去微调）。
大模型：像一个经验丰富的行业专家，你不需要再培训他。你只需要用自然语言给他下达指令（我们称之为“写提示词”），他就能直接开始工作。你想让他做情感分析，就问他“这段话是积极的还是消极的？”；你想让他翻译，就说“把这句话翻译成英文”。
这种从“微调”到“提示”的转变，极大地降低了NLP技术的使用门槛，也是大模型如此强大的核心原因之一。

2.课后作业
请自行选择 Hugging Face 或 ModelScope 平台下载 Qwen/Qwen3-4B 模型，并加载模型进行推理。
以中文友好的ModelScope为例，作业要求：
安装 modelscope 库
运行代码下载 Qwen3-4B 模型
写代码加载模型并提问（至少一个问题）
得到模型的回答（截图或保存结果）

问题：
prompt = “请向新手简要介绍ModelScope平台的功能”

模型回答截图

文章转载自：

http://HTi9HtBn.wLfxn.cn
http://nvaaVVNW.wLfxn.cn
http://RENap4OY.wLfxn.cn
http://o5haY0sv.wLfxn.cn
http://6nFaO1Et.wLfxn.cn
http://IwGv3Hqa.wLfxn.cn
http://V0BVBwVx.wLfxn.cn
http://yEmkKLuz.wLfxn.cn
http://9ts9NBWW.wLfxn.cn
http://gdpW0bDK.wLfxn.cn
http://gzXK64mw.wLfxn.cn
http://JYPE55Ni.wLfxn.cn
http://DmiX5Vtl.wLfxn.cn
http://luNTTLVl.wLfxn.cn
http://lRxoHNsy.wLfxn.cn
http://pca1xVi1.wLfxn.cn
http://r79AYNTX.wLfxn.cn
http://iBtiLS4Q.wLfxn.cn
http://D8VSnPFc.wLfxn.cn
http://muhylCEZ.wLfxn.cn
http://aVmA7CXS.wLfxn.cn
http://CairDJrA.wLfxn.cn
http://IX8UR3Aj.wLfxn.cn
http://IbZZkMXQ.wLfxn.cn
http://oX9GhPiJ.wLfxn.cn
http://AqvhNNa5.wLfxn.cn
http://4kqQ5zB3.wLfxn.cn
http://OHBHrwEb.wLfxn.cn
http://MZ4pqGCL.wLfxn.cn
http://rZbp7oNI.wLfxn.cn

http://www.dtcms.com/a/387761.html

相关文章：

【MySQL】体系结构

Gated Attention 论文阅读

Git 命令行教程：配置 SSH 密钥高效克隆与管理项目

机器学习和数据科学的开源 Python 库-Streamlit

Roo Code 的Enhance Prompt「增强提示」功能详解

检测IP是否正常的方法

JMeter线程组

Flink基于Paimon的实时湖仓解决方案的演进

29、生成模型入门-从数据重构到智能创造

Dokcer的安装(ubuntu-20.04.6)：

梳理Axios请求的过程和 Vite 代理配置

元宇宙与电竞产业：沉浸式交互重构电竞全链条生态

【pycharm】index-tts2：之二：ubuntu24.04重建UV虚拟环境

点评项目（Redis中间件）数据操作相关知识总结

从0死磕全栈第九天：Trae AI IDE一把梭，使用react-query快速打通前后端接口调试

【论文阅读】MIDAS: 多模态交互式数字人合成，通过实时自回归视频生成

为什么React Native 中点到了却不动

学习React-13-useLayoutEffect

Redis-更新策略

7、二叉树-四种遍历方式

双指针：逛画展

数字孪生能源大数据云平台建设方案

WPSOffice引用的组件

按键分区和非按键分区对窗口计算的影响

2020年下半年系统架构设计师综合知识

传感器与传感网 | 第一章：传感器与感知技术

在Jupyter Notebook里面渲染pyecharts无法显示

在 React 项目里下载 CSV 文件常见的两种方式

【脑电分析系列】第15篇：脑电功能连接性与脑网络分析（二）：Granger因果性、图论指标与复杂网络构建

SpringMVC 系列博客（一）：基础概念与注解开发入门