当前位置：首页 > news >正文

nanoGPT 部署

news 2025/8/23 6:05:35

NanoGPT 是由 Andrej Karpathy（前特斯拉 AI 总监）开源的一个 极简版 GPT（Generative Pre-trained Transformer）实现。
它的目标不是直接用于大规模商业应用，而是 教育、研究和实验，帮助人们理解 GPT 模型的核心原理。

特点：

代码简洁、结构清晰，便于阅读。
模型规模小，适合在个人电脑上训练和测试。
使用 PyTorch 实现，方便修改和扩展。

Github 地址：https://github.com/karpathy/nanoGPT#

1. 使用 Anaconda 创建 python 虚拟环境

conda create --prefix D:\conda_envs\nanoGPT python=3.9

--prefix：指定虚拟环境安装的位置

我的电脑是 RTX5060 CUDA12.8，下载如下版本的 pytorch

pip3 install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu128
或 Anaconda Prompt 中运行：python -m pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu128

安装代码的相关依赖

pip install  tiktoken

2. 拉取代码

git clone https://github.com/karpathy/nanoGPT.git

3. 运行

python data/shakespeare_char/prepare.py

在 config/train_shakespeare_char.py 文件中加上 compile = False，再运行

python train.py config/train_shakespeare_char.py

python sample.py --out_dir=out-shakespeare-char

查看全文

http://www.dtcms.com/a/343942.html

解决 SymPy Lambdify 中的符号覆盖与语法错误问题

本地组策略编辑器图形化工具

STM32 - Embedded IDE - GCC - 重定向printf到串口

pytorch 网络可视化

网易云音乐歌曲导出缓存为原始音乐文件。低调，低调。。。

爬虫逆向之易盾文字点选分析

Kafka消息丢失的场景有哪些

漏洞分析 | Kafka Connect 任意文件读取漏洞（CVE-2025-27817）

selenium爬虫

开源 vs 商业 DevOps 平台：如何选择最适合你的方案？

Elasticsearch高能指南

学习：uniapp全栈微信小程序vue3后台（3）

嵌入式Linux学习 -- 网络1

StarRocks启动失败——修复全流程

姓名重名查询抖音快手微信小程序看广告流量主开源

恢复性测试：定义、重要性及实施方法

Linux设备模型交互机制详细分析

分段渲染加载页面

第9课：本地功能集成

宋红康 JVM 笔记 Day06｜虚拟机栈

Seaborn数据可视化实战：Seaborn数据可视化基础-从内置数据集到外部数据集的应用

学习游戏制作记录（合成表UI和技能树的UI）8.22

Python打卡Day49 CBAM注意力

小迪安全v2023学习笔记（六十九讲）—— Java安全JWT攻防监控组件泄露接口

北斗导航｜基于MCMC粒子滤波的接收机自主完好性监测（RAIM）算法（附matlab代码）

【C++组件】Elasticsearch 安装及使用

ODYSSEY：开放世界四足机器人的探索与操控，助力长范围任务

ref 简单讲解

【前端教程】从基础到进阶：淘宝 HTML 界面“回到顶部”功能的交互升级实战

刷题日记0822

相关文章：