当前位置: 首页 > news >正文

局域网网站怎样做数据库wordpress 做app

局域网网站怎样做数据库,wordpress 做app,物业管理系统er图,广州各区进一步强化🚀 实践步骤概览 今天我们要在MAC上完成一个完整的AI项目闭环: 微调一个大模型 → 2. 导出模型并部署 → 3. 暴露API给web后端 → 4. 前端展示 🛠️ 微调模型准备 核心配置 框架:LLama-Factory 🏭 算法&#xff1a…

🚀 实践步骤概览

今天我们要在MAC上完成一个完整的AI项目闭环:

  1. 微调一个大模型 → 2. 导出模型并部署 → 3. 暴露API给web后端 → 4. 前端展示


🛠️ 微调模型准备

核心配置

  • 框架:LLama-Factory 🏭

  • 算法:LoRA (低秩适应) 🧠

  • 基座模型deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B (来自HuggingFace)


📥 第一步:下载LLama Factory

# 如果下载失败的话,可以手动下载压缩包
git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
# 下载依赖包
pip install -e ".[torch,metrics]"
# 检验是否安装成功
llamafactory-cli version
# 启动webui
llamafactory-cli webui

💡 小贴士:部署成功后会自动弹出localhost:7860的页面哦!


🧩 基座模型下载

曲折经历:原本想用huggingface-cli命令下载,但多次尝试失败后,我选择了手动下载...

mkdir Hugging-Face
# 将下载的模型放在该目录下
  1. 指定模型路径

  2. 点击加载按钮

  3. 等待模型加载完成


📚 准备微调数据

参考LLama-Factory的身份训练数据模板,替换{{name}}{{author}}

[{"instruction": "你好","input": "","output": "您好,我是 {{name}},一个由 {{author}} 开发的 AI 助手,很高兴认识您。请问我能为您做些什么?"
},
{"instruction": "你好","input": "","output": "您好,我是 {{name}},一个由 {{author}} 打造的人工智能助手,请问有什么可以帮助您的吗?"
}]

关键操作

  1. 创建magic_conch.json文件放在LLama-Factory/data

  2. dataset_info.json中添加配置:

"magic_conch": {"file_name": "magic_conch.json"},

⚙️ 微调参数设置与执行

微调完成后

  1. 在chat界面卸载模型

  2. 选择检查点重新导入

  3. 测试提问"我是谁",验证微调效果


📦 导出完整模型

mkdir -p Models/deepseek-r1-1.5b-merged

🔍 技术说明:LoRA只是低秩矩阵,调整了部分权重,需要合并导出完整模型

在UI上:

  1. 选择export(导出)

  2. 选择导出设备为auto

  3. 设置导出路径

  4. 点击导出按钮


🌐 创建FastAPI接口

from fastapi import FastAPI
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch
​
app = FastAPI()
# 模型路径
model_path = "/Users/xxx/deepseek/Models/deepseek-r1-1.5b-merged"
# 加载 tokenizer (分词器)
tokenizer = AutoTokenizer.from_pretrained(model_path)
# 加载模型并移动到可⽤设备(GPU/CPU)
device = "cuda" if torch.cuda.is_available() else "cpu"
model = AutoModelForCausalLM.from_pretrained(model_path).to(device)
​
@app.get("/generate")
async def generate_text(prompt: str):inputs = tokenizer(prompt, return_tensors="pt").to(device)outputs = model.generate(inputs["input_ids"], max_length=150)generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)return {"generated_text": generated_text}
​
if __name__ == '__main__':import uvicornuvicorn.run(app,host='localhost',port=8060)

☕ Java后端调用示例

关键代码(完整项目见GitHub):

@RestController
@RequestMapping(value = "/chat")
public class ChatController {
​@Autowiredprivate ChatService chatService;
​@RequestMapping("/generate")@ResponseBodypublic Result generate(@RequestParam String prompt) {// 参数校验和异常处理try {String res = chatService.callAiForOneReply(prompt);return Result.success().setData(res);} catch (Exception e) {return Result.error();}}
}
@Service
public class ChatServiceImpl implements ChatService {@Autowiredprivate RestTemplate restTemplate;public String callAiForOneReply(String prompt) {String url = String.format("%s/generate?prompt=%s", aiServiceConfig.getBaseUrl(), prompt);GenerateResponse response = restTemplate.getForObject(url, GenerateResponse.class);return response != null ? response.getGenerated_text() : "";}
}

🎉 大功告成!

现在你已经完成了:

  1. 模型微调

  2. 模型导出

  3. API服务搭建

  4. 后端集成

下一步:可以开始设计炫酷的前端界面啦!🚀

💬 遇到问题?欢迎在评论区交流讨论~

http://www.dtcms.com/a/476241.html

相关文章:

  • 建交互网站需要多少钱机械加工工时计算软件
  • 绍兴外贸网站建设网站屏蔽省份
  • 电商 企业网站 福州商超运营与管理
  • 做网站的收益来源汕头网站seo外包
  • 斗鱼类的直播网站开发网站建设网站备案所需资料
  • 徐州做网站建设市场营销策略的概念
  • 郑州网站建设选微锐x1营销型网站建设
  • 百度优化 几个网站内容一样软文怎么写吸引人
  • 石家庄网站建设咨询薇网站建设有趣名称
  • 梅地卡伦手表网站dreamwear做网站步骤
  • 咸阳做网站开发公司三星网上商城退款很慢
  • UE5 测量 -7,面积测量:事件分发,面积测量大纲,设置样条点闭合,禁止定位球碰撞,对连接线的参数标量化处置,宏定义,对数组的两种循环方式,
  • 关于茶文化网站建设的背景网站制作西安企业网站制作
  • 北京优化网站外包公司网站安全建设模板
  • 网站建设有什么优点房产律师在线咨询电话免费
  • 广州网站优化服务商制作网站复杂吗
  • 视频网站系统开发网站建设系统规划方案
  • wordpress可以做下载站福州网站制作官网
  • 网站建设发展趋势wordpress 所有标签页
  • 网站上传的流程小程序免费制作平台360
  • 成都建设银行网站徐州最大网架公司
  • 建设网站网站设计云南网站建设一度科技公司
  • php电影播放网站开发dedecms购物网站
  • 湖南网站推广公司南昌网站建设托管
  • 诛仙2官方网站西施任务怎么做福建省建设工程执业注册管理中心网站
  • 为什么自己做的网站打开是乱码百度服务平台
  • 北京网站设计济南兴田德润评价网站开发程序员的工资是多少
  • 供需平台类网站建设画册做的比较好的网站
  • 网站网站开发需要多少钱asp网站数据库位置
  • 电子政务门户网站建设的意义wordpress如何给指定位置添加代码