当前位置: 首页 > news >正文

东营网站建设培训网站设计一般包括

东营网站建设培训,网站设计一般包括,杭州市招投标交易中心,wordpress添加首页一、为什么选择OllamaDeepSeek组合? 1.1 DeepSeek模型的三大核心优势 中文语境霸主:在C-Eval榜单中,7B参数版本以82.3%准确率超越Llama2-13B6硬件友好:Int4量化后仅需5.2GB存储空间,GTX1060即可运行多模态扩展&#…

一、为什么选择Ollama+DeepSeek组合?

1.1 DeepSeek模型的三大核心优势

  1. 中文语境霸主:在C-Eval榜单中,7B参数版本以82.3%准确率超越Llama2-13B6
  2. 硬件友好:Int4量化后仅需5.2GB存储空间,GTX1060即可运行
  3. 多模态扩展:支持与Stable Diffusion联动生成图文报告

1.2 Ollama的颠覆性价值

相较于传统部署方式,Ollama带来三大突破:

  1. 开箱即用:一条命令完成模型拉取与服务启动
  2. 跨平台推理:原生支持Windows/Linux/macOS ARM架构
  3. 生态集成:完美对接LangChain、AutoGPT等AI框架5

二、Windows环境准备(避坑指南)

如果不想本地部署,推荐使用硅基流动官方提供的云化版满血deepseek,前往 硅基流动官网 登录注册。现在注册赠送14元额度,免费体验。

2.1 硬件最低配置

在这里插入图片描述

2.2 软件环境搭建

  1. 步骤1:安装Windows终端增强版
# 管理员模式运行 
winget install Microsoft.WindowsTerminal 
  1. 步骤2:配置WSL2(GPU加速必备)
dism.exe  /online /enable-feature /featurename:Microsoft-Windows-Subsystem-Linux /all /norestart 
dism.exe  /online /enable-feature /featurename:VirtualMachinePlatform /all /norestart 
wsl --set-default-version 2 
  1. 步骤3:安装Ollama主程序

从官网 下载Windows版安装包,双击执行后验证:

ollama --version # 显示0.5.3即为成功
注意:上诉方法安装后直接在电脑C盘,如果对于C盘空间不足的同学可以按以下方式制定目录安装到其他盘。

首先将下载的ollama.exe程序放到指定目录(默认下载目录也可以),通过powerShell进入到安装文件所在目录。执行以下安装命令:

.\Ollama.exe /DIR=“你要安装的目录的绝对路径”

三、DeepSeek模型部署四步走

此处可以通过Ollama官网,点击Models查看要下载的模型命令信息。Ollama官网R1模型

在这里插入图片描述

3.1 模型拉取与量化选择

在下载模型前,需要注意,直接运行下方命令后,下载的模型默认还是存储在C盘的,可以通过以下方式先配置模型存储路径,再下载。

修改Windows环境变量,增加系统变量:OLLAMA_MODELS ,变量值是需要下载的路径。

下载安装模型包。

# 拉取官方7B模型(约4.9GB)ollama run deepseek-r1:7b

也可以选择其他模型,命令从Ollama官网查看。
在这里插入图片描述

3.2 启动模型服务

执行万上述命令后,安装已完成,如下所示
在这里插入图片描述

3.3 API接口测试

测试RESTful API

curl http://localhost:11434/api/generate -d '{"model": "deepseek","prompt": "用Python实现快速排序","stream": false 
}'

此处是通过api形式调用

3.4 客户端集成示例

Python调用示例

from ollama import Client 
client = Client(host='http://localhost:11434')
response = client.chat(model='deepseek',  messages=[{'role': 'user', 'content': '解释Transformer架构'}
])
print(response['message']['content'])

四、性能优化与生产级部署

4.1 GPU加速配置

修改%APPDATA%/ollama/config.json :

{"runners": {"nvidia": {"enable": true,"runtime": "cuda"}}
}

验证CUDA状态:

ollama info | grep cuda # 显示"cuda_available": true

4.2 量化方案对比测试

在这里插入图片描述

4.3 企业级安全加固

  1. HTTPS加密:使用Nginx反向代理配置SSL证书
  2. 访问控制:在config.json 添加IP白名单
  3. 审计日志:启用OLLAMA_LOG_LEVEL=debug记录完整操作
  4. 五、实战场景:私有知识库构建

5.1 LangChain集成方案

from langchain_community.embeddings  import OllamaEmbeddings 
from langchain_community.vectorstores  import Chromaembeddings = OllamaEmbeddings(model="deepseek")
docsearch = Chroma.from_documents(docs,  embeddings)retriever = docsearch.as_retriever( search_type="mmr", search_kwargs={'k': 3}
)

5.2 RAG问答系统搭建

from langchain_core.prompts  import ChatPromptTemplate 
template = """基于以下上下文:
{context}问题:{question}
"""
prompt = ChatPromptTemplate.from_template(template) chain = ({"context": retriever, "question": RunnablePassthrough()} | prompt | model | StrOutputParser()
)

六、常见问题解决方案

6.1 模型加载失败排查

  1. CUDA内存不足:添加–num_gpu 30减少显存占用
  2. 中文乱码:设置环境变量set PYTHONUTF8=1
  3. 响应超时:在启动命令后追加–request_timeout 600

6.2 性能优化检查表

  1. 使用nvtop监控GPU利用率
  2. 通过ollama ps查看线程绑定状态
  3. 定期执行ollama prune清理缓存
http://www.dtcms.com/a/468046.html

相关文章:

  • 公司 网站建设 简介网站设计建设流程
  • 做营销网站策划有什么前景网站运营需要做什么
  • 移动网站建设查询杭州网站优化服务
  • 无锡网站制作优化推广东阳网站制作
  • 做h游戏视频网站有哪些中国机械加工网19易5下2拉i
  • 网站猜你喜欢代码台州自助建站
  • 没有域名能做网站吗去哪学网页设计
  • .net美食网站开发源代码搜索引擎友好网站表现
  • 宠物网站建设策划书这周新闻热点事件
  • 做网站龙岗做网站销售的技巧
  • 珠海十大网站建设公司哪家好婚纱摄影类网站模板
  • 做手机网站用什么企业网站建设需要费用
  • 企业网站推广内容腾宁科技做网站399元全包
  • 注册网站免费注册qq邮箱wordpress php 结构
  • 网站 维护 协议wordpress more标签失效
  • 网站建设商标保护阿里云万网域名
  • 网站顶部导航代码国家企业信用信息公示系统查询网
  • 论坛网站平台建设方案做一些网站的弹出页面
  • 蓝奏云注册网站常用的网站建设技术
  • wordpress怎么在主页显示产品网站文件夹命名seo
  • 制作网站品牌公司简介注册一个公司需要多少钱?
  • 杭州优质网站建设马拉松网站建设
  • 衡水做企业网站的公司最新网站发布
  • 什么是域名解析做seo网站要多少钱
  • 合肥最好的网站建设公司哪家好马鞍山的网站建设公司
  • 想自己在家做外贸网站wordpress更改登陆地址
  • 松江移动网站建设常德网站建设要点
  • 做企业网站国内发展魔域永恒网页游戏
  • 七种排序算法比较与选择[Python ]
  • 贵州省住房和城乡建设厅查询网站首页网站切图大图