当前位置: 首页 > news >正文

LLM run

  • lmstudio
    lmstudio

  • ollama
    ollama

  • N 卡使用自带UI gpu加速推理 ,选择满足条件的,

  • ds模型选择列表
    https://ollama.com/library/deepseek-r1

  • a卡当前支持的显卡型号
    在这里插入图片描述

  • I卡 gpu加速配置

  • 2025.3 intel Official project optimization
    https://www.modelscope.cn/models/ipexllm/ollama-ipex-llm#Windows-%E4%BD%BF%E7%94%A8%E6%8C%87%E5%8D%97

anaconda + pip ipex-llm是愚蠢的废弃方案

  • 清理无用的pip所下载包
pip list
pip uninstall 包名

# 删除所有已安装的包
# window environment need download this
pip freeze | % {pip uninstall -y $_}
pip freeze | ForEach-Object { pip uninstall -y $_ }
  • ipex-llm
    https://github.com/intel/ipex-llm
  • anaconda
    anaconda
    在这里插入图片描述
  • py
    py
    在这里插入图片描述

https://zhuanlan.zhihu.com/p/25124843480

相关文章:

  • 利用Postman和Apipost进行API测试的实践与优化-动态参数
  • SpringMvc的设计模式
  • Blazor-全局路由跳转事件
  • 污酸提铼系统提升改造工艺
  • k8s面试题总结(十)
  • TDengine SQL查询语法
  • 基于Spring Boot + Vue的图书个性化推荐系统(LW+PPT)
  • flask实现mvc模式
  • JVM内存结构和各种结构的作用
  • 蓝桥备赛(11)- 数据结构、算法与STL
  • VMware虚拟机中CentOS8系统账户,忘记密码怎么找回
  • [内网安全] Windows 域认证 — Kerberos 协议认证
  • Objective-C 中 @synthesize VS @dynamic
  • 每日一题——缺失的第一个正数
  • Taro React组件开发 —— RuiNoticeBar 通知栏
  • K8S高可用集群-小白学习之二进制部署(ansible+shell)
  • T31ZC 君正SOC芯片 应用于智能家居、工业控制等 满足各种嵌入式应用的需求 提供样品测试+软硬件资料
  • docker-compose安装redis-主从+哨兵(3台虚拟机一主两从)
  • 深度学习模型组件-RevNorm-可逆归一化(Reversible Normalization)
  • 行为模式---迭代器模式
  • 如何做擦边球网站/德国搜索引擎
  • 网站搜索引擎提交/广告营销留电话网站
  • 网络设计的原理/深圳关键词推广整站优化
  • 求个没封的a站2022/google play下载安卓
  • 网站 空间 是什么/广州网站设计
  • 网站html静态化/一起来看在线观看免费