当前位置: 首页 > news >正文

大模型的第一天学习-LM studio的安装和本地大模型搭建

大模型的第一天学习-LM studio的安装和本地大模型搭建

    • 一、下载安装,加载模型
    • 二、使用本地服务器
    • 三、模型参数的学习
    • 四、一些必要的知识

一、下载安装,加载模型

  1. 直接在官网下载lm studio
  2. 将下载模型加载进来。可以通过hugging face下载模型,也可以直接拷贝。或者直接搜索“发现”

二、使用本地服务器

因为我对python和post链接熟悉一点,就打算使用python去链接lm studio来使用大模型,来实现本地化。

  1. 在“开发者”启动允许本地链接,并得到端口数据
  2. 在cmd钟输入ipconfig,得到ipv4地址
  3. 得到链接地址:http://localhost:1234/v1/chat/completions

在这里插入图片描述

下面是代码,要填入正确的ipv4和端口。( “top_k”: 10,“temperature”:0.9,。。。“max_tokens”: 30000,这些连七八糟的模型参数现在可以不加,不影响使用,以后慢慢来。。。)

import requests
url = "http://1.1.1.11:1234/v1/chat/completions"
data = {"model":"deepseek-r1-distill-llama-8b","messages": [{"role": "system", "content": "你是一个专业的助手。"},{"role": "user", "content": f"""
对于email信息,可以按以下分类方法进行分类:类型:<会议通知><信息知会><待办事宜><问询>紧急程度:<紧急><优先><普通>
分级方法:
如果包括手机等个人信息,为4级,否则为1级。
以下是两份email,请进行分类分级:
张三:
昨天下午,2378号项目出现现场故障,针对此问题,我们将于今天下午两点在3号会议室开会讨论请按时参加。有关项目的信息,可以与李四联系,联系电话13912345678"""}]
}try:# 发送 POST 请求(无数据)response = requests.post(url,json=data)# 打印响应状态码和内容print("Status Code:", response.status_code)print("Response Body:", response.text)except requests.exceptions.ConnectionError as e:print("连接失败,请确认:")print("- 目标服务器是否运行中")print("- 端口是否正确")print("- IP 地址是否正确")

三、模型参数的学习

  1. top_k (候选单词的个数)只有排名前k的词会被考虑
  2. top_p (概率)从模型的概率分布中抽样时,只会考虑累积概率达到top_p的那些词
  3. temperature 控制生成文本的随机性
  4. max_tokens 设置生成文本的最大长度
  5. frequency_penalty 正值减少高频词的出现
  6. presence_penalty 正值会惩罚重复出现的话题,鼓励探索新的主题

四、一些必要的知识

自回归生成:大语言模型是通过重复生成token序列(sequence)中的下一个token来运作的。每次模型想要生成另一个token时,会重新阅读整个token序列并预测接下来应该出现的token。

相关文章:

  • IntelliJ IDEA 使用教程
  • Python Cookbook-6.16 用 Borg 惯用法来避免“单例”模式
  • 系统思考与第一性原理
  • XCTF-pwn(二)
  • 从 Eclipse Papyrus / XText 转向.NET —— SCADE MBD技术的演化
  • MATLAB绘制局部放大图
  • 环境搭建:开启 Django 开发之旅
  • C++11新特性_标准库_正则表达式库
  • 如何理解 MCP 和 A2A 的区别?|AI系统架构科普
  • AI算法可视化:如何用Matplotlib与Seaborn解释模型?
  • 读懂 Vue3 路由:从入门到实战
  • maven install时报错:【无效的目标发行版: 17】
  • MIT XV6 - 1.2 Lab: Xv6 and Unix utilities - pingpong
  • 每日一题洛谷P8635 [蓝桥杯 2016 省 AB] 四平方和c++
  • 移动端开发中设备、分辨率、浏览器兼容性问题
  • ICCV2021 | 重新思考并改进视觉 Transformer 的相对位置编码
  • 专题二十二:DHCP协议
  • 使用PyMongo连接MongoDB的基本操作
  • 4.2 math模块
  • 力扣面试150题--分隔链表
  • 竞彩湃|拜仁冲冠战役或有冷门,大巴黎留力欧冠半决赛
  • 5月2日,全社会跨区域人员流动量完成29275.4万人次
  • 波兰斯基最新回忆录追述“二战”童年往事
  • 5月1日,多位省级党委书记调研旅游市场、假期安全等情况
  • 多地景区发公告称售票达接待峰值,有景区暂停网络和线下售票
  • 讲武谈兵|朝鲜“崔贤”号驱逐舰下水,朝版“宙斯盾”战力如何?