当前位置：首页 > news >正文

大模型chagpt原理（持续更新）

news 2025/7/1 21:33:41

20250210更新：

根据李宏毅课程可知，大模型chatgpt基本原理分为三步（每一步都是在做文字接龙，但训练资料不同）

一、依赖大量网上文章、维基百科等资料训练

对资料进行去重，劣质优质划分，过滤等操作，将资料划分为一笔笔训练样本

二、人工标注样本进行有监督训练

三、强化学习

基于模型生成的几个答案进行打分，若打分较高，则微调模型参数，使得模型生成打分高的答案概率较高

http://www.dtcms.com/a/13696.html

相关文章：

新数据结构(4)——Java继承

springboot配置https

【Prometheus】prometheus结合cAdvisor监控docker容器运行状态，并且实现实时告警通知

编码格式大全解释以及相关编码特性

Spring Boot整合DeepSeek实现AI对话（API调用和本地部署）

DeepSeek-R1技术革命：用强化学习重塑大语言模型的推理能力

10. Hbase Compaction命令

webpack配置之---output.publicPath

机器翻译同样的文本，是从英语翻译成日语更准确还是中文翻译成日语更准确

语言大模型基础概念一（先了解听说过的名词都是什么）

[Redis] Redis分布式锁与常见面试题

x64、aarch64、arm与RISC-V64：详解四种处理器架构

2024年博客之星年度评选—创作影响力评审+主题文章创作评审目前排名(2024博客之星陪跑小分队助力2024博客之星创作者成长)

从云原生到 AI 原生，谈谈我经历的网关发展历程和趋势

微服务与网关

数仓:核心概念,数仓系统(ETL,数仓分层,数仓建模),数仓建模方法(星型模型,雪花模型,星座模型)和步骤

mongodb

【Spring】什么是Spring？

Hive增量迁移方案与实操PB级

STM32系统架构介绍

使用 LangChain 对接硅基流动（SiliconFlow）API：构建一个智能对话系统

SpringBoot分布式应用程序和数据库在物理位置分配上、路由上和数量上的最佳实践是什么？

一文速览DeepSeek-R1的本地部署——可联网、可实现本地知识库问答：包括671B满血版和各个蒸馏版的部署

Python Pandas（11）：Pandas 数据可视化

shell脚本自动安装MySQL8

使用Redis实现分布式锁，基于原本单体系统进行业务改造

python-leetcode 31.K个一组翻转链表

Selenium常用自动化函数

Jenkins 通过 Execute Shell 执行 shell 脚本七

读取本地excel并生成map，key为第一列，value为第二列