当前位置: 首页 > news >正文

Ollama 部署大模型

概述

Ollama是一个开源框架,‌专门设计用于在本地运行大型语言模型。‌它的主要特点是将模型权重、‌配置和数据捆绑到一个包中,‌从而优化了设置和配置细节,‌包括GPU使用情况,‌简化了在本地运行大型模型的过程,采用WSL2作为运行环境。WSL2是WINDOWS的Linux虚拟机,此案例使用的是Ubuntu 22.04.3 LTS (GNU/Linux 5.15.167.4-microsoft-standard-WSL2 x86_64)版本系统

安装

curl -fsSL https://ollama.com/install.sh | sh
sudo chmod +x /usr/bin/ollama

运行(当前使用qwen1.5的模型)

此模型4.7G,下载会比较慢,不要中断,不要中断,不要中断!!!

ollama run qwen:7b

后台启动

# 修改ollama的service文件:/etc/systemd/system/ollama.service
# 在[Service]下边增加一行:Environment="OLLAMA_HOST=0.0.0.0:11434",端口根据实际情况修改
systemctl daemon-reload
systemctl stop ollama
systemctl start ollama
systemctl status ollama

启动WEBUI

前置条件,本地已安装Docker。执行命令后,通过浏览器访问http://localhost:8080即可打开页面。

命令中192.168.0.216为本机IP地址

docker run -d -p 8080:8080 -e OLLAMA_BASE_URL=http://192.168.0.216:11434 -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

常用命令

# 拉取LLM
ollama pull qwen:7b

#拉取Embedding
ollama pull quentinz/bge-large-zh-v1.5

相关文章:

  • Java 集合:单列集合和双列集合的深度剖析
  • 基于Flask的去哪儿网海南旅游攻略数据分析系统的设计与实现
  • 2025吐槽季第一弹---腾讯云EO边缘安全加速平台服务
  • Graspness Discovery in Clutters for Fast and Accurate Grasp Detection 解读
  • RoCBert:具有多模态对比预训练的健壮中文BERT
  • 细说STM32F407单片机2个ADC使用DMA同步采集各自的1个输入通道的方法
  • 【开源免费】基于SpringBoot+Vue.JS物流管理系统(JAVA毕业设计)
  • 如何把虚拟机拷贝到另一台VMware里?
  • mysql之MySQL 优化器追踪 (Optimizer Trace):洞察优化器决策的每一个细节
  • 联通用户管理系统(二)
  • 基于SSM的《计算机网络》题库管理系统(源码+lw+部署文档+讲解),源码可白嫖!
  • 软件架构设计:网络基础
  • 计算机网络————(一)HTTP讲解
  • 百度搜索,能否将DeepSeek变成“内功”?
  • 【Linux】:应用层协议 HTTP (超文本传输协议)
  • 和平之翼代码生成器 SHCEU 版 4.0.0RC6 千年隼介绍二
  • 深入理解C语言中的位段
  • 【Linux】匿名管道的应用场景-----管道进程池
  • 基于深度学习的信号滤波:创新技术与应用挑战
  • 基于SpringBoot+vue+uniapp的智慧旅游小程序+LW示例参考
  • 中华人民共和国和俄罗斯联邦关于进一步加强合作维护国际法权威的联合声明
  • 优化网络营商环境,上海严厉打击涉企网络谣言、黑灰产等违法犯罪
  • 公募基金行业迎系统性变革:基金公司业绩差必须少收费
  • 重庆动物园大熊猫被游客扔玻璃瓶,相同地方曾被扔可乐瓶
  • 过半中国上市公司去年都在“扩编”,哪些公司人效最高
  • 涉个人信息收集使用问题,15款App和16款SDK被通报