当前位置: 首页 > wzjs >正文

山东网站建设SEO优化制作设计公司html网页制作模板免费

山东网站建设SEO优化制作设计公司,html网页制作模板免费,兰州网站建设优化,微信小程序费用有哪些一、llama.cpp 介绍 使用纯 C/C推理 Meta 的LLaMA模型(及其他模型)。主要目标llama.cpp是在各种硬件(本地和云端)上以最少的设置和最先进的性能实现 LLM 推理。纯 C/C 实现,无任何依赖项Apple 芯片是一流的——通过 A…

一、llama.cpp 介绍

使用纯 C/C++推理 Meta 的LLaMA模型(及其他模型)。主要目标llama.cpp是在各种硬件(本地和云端)上以最少的设置和最先进的性能实现 LLM 推理。纯 C/C++ 实现,无任何依赖项Apple 芯片是一流的——通过 ARM NEON、Accelerate 和 Metal 框架进行了优化AVX、AVX2、AVX512 和 AMX 支持 x86 架构1.5 位、2 位、3 位、4 位、5 位、6 位和 8 位整数量化,可加快推理速度并减少内存使用用于在 NVIDIA GPU 上运行 LLM 的自定义 CUDA 内核(通过 HIP 支持 AMD GPU,通过 MUSA 支持 Moore Threads MTT GPU)Vulkan 和 SYCL 后端支持CPU+GPU 混合推理,部分加速大于 VRAM 总容量的模型。

Github 地址:https://github.com/ggerganov/llama.cpp
下载地址:https://github.com/ggerganov/llama.cpp/releases

二、 llama.cpp安装

llama.cpp:基于C++重写了 LLaMa 的推理代码,是一种推理框架。支持动态批处理,支持混合推理。
llama.cpp:只支持 gguf 格式的模型,可以自己生成或从 huggingface 等平台下载 gguf 格式的模型;
在这里插入图片描述

2.1、llama.cpp:纯 CPU 运行,并且支持 avx512 指令集,

地址:https://github.com/ggerganov/llama.cpp/releases/download/b4658/llama-b4658-bin-win-avx512-x64.zip,
#运行参数配置:https://github.com/ggerganov/llama.cpp/tree/master/examples/server
#下载完成后,解压到 D:\llama-b4658-bin-win-avx512-x64 目录

linux

##llama.cpp
git clone https://github.com/ggerganov/llama.cpp
cd llama.cpp/
make##下载模型并转换
conda create -n llamacpp python=3.12
conda activate llamacpp
pip install -r requirements.txt###下载模型到 models/ 目录下
cd models
sudo apt-get install git-lfs
# or
git lfs install
git clone https://www.modelscope.cn/qwen/Qwen2-0.5B-Instruct.git
./llama-cli -m models/Qwen2-0.5B-Instruct/Qwen2-0.5B-Instruct-F
16.gguf -p hello -n 256
$推理测试

2.2、DeepSeek-R1 模型

下载地址:https://hf-mirror.com/lmstudio-community/DeepSeek-R1-Distill-Qwen-1.5B-GGUF/tree/main,本文以#“DeepSeek-R1-Distill-Qwen-1.5B-Q3_K_L.gguf”为例。

在这里插入图片描述

2.3llama.cpp 部署 DeepSeek-R1 模型

在 DeepSeek-R1-Distill-Qwen-1.5B-Q3_K_L.gguf 文件目录下面执行如下命令:
chcp 65001set PATH=D:\llama-b4658-bin-win-avx512-x64;%PATH%llama-server -m DeepSeek-R1-Distill-Qwen-1.5B-Q3_K_L.gguf --port 8080

在这里插入图片描述

使用浏览器打开 http://127.0.0.1:8080/ 地址进行测试,

curl --request POST \--url http://localhost:8080/completion \--header "Content-Type: application/json" \--data '{"prompt": "

Building a website can be done in 10 simple steps:",“n_predict”: 128}’


文章转载自:

http://tablMahf.ssgqc.cn
http://S0DoBfox.ssgqc.cn
http://yNfjcmlx.ssgqc.cn
http://S7lekfUN.ssgqc.cn
http://lqFJ0kCp.ssgqc.cn
http://77fbIMGS.ssgqc.cn
http://8B8aWBHs.ssgqc.cn
http://8YFiOpaZ.ssgqc.cn
http://8182GPf6.ssgqc.cn
http://9Hz8ctRS.ssgqc.cn
http://liWQYZks.ssgqc.cn
http://ltipYVNO.ssgqc.cn
http://1ylYY3Hk.ssgqc.cn
http://HD8CBRRQ.ssgqc.cn
http://8bkUmDZr.ssgqc.cn
http://h4aV6IPk.ssgqc.cn
http://wHUjQyvD.ssgqc.cn
http://47KNl8B0.ssgqc.cn
http://fnfIjodt.ssgqc.cn
http://VmWPOO3y.ssgqc.cn
http://vNhge10P.ssgqc.cn
http://jQ5XvP8R.ssgqc.cn
http://UM4fp4Dd.ssgqc.cn
http://WZruiptf.ssgqc.cn
http://tb3EbmTo.ssgqc.cn
http://KQs0f8Fo.ssgqc.cn
http://HdDsvdTu.ssgqc.cn
http://HsmjCJvv.ssgqc.cn
http://ymhBHaSq.ssgqc.cn
http://WNSZnE78.ssgqc.cn
http://www.dtcms.com/wzjs/651290.html

相关文章:

  • 注册网站给谁交钱遮罩层怎么做网页
  • 网站建设分几类网页app生成器最新版
  • 网站建设平台选用及分析网站建设所需技术
  • 永康做企业网站的公司郑州做网站推广地
  • 广州市企业网站制作网站建设合同的主要内容
  • 企业网站模块电商网站的建设案例
  • 做网站一定要购买虚拟主机吗建筑企业培训课程
  • 设计公司的网站建设做国外wordpress賺钱
  • 郑州网站建设公司电话多少企业工资管理系统软件
  • 东莞企业网站推广怎么做2018年网站建设工作总结
  • 企业网站形象建设怎么推广引流
  • 怎么有自己的网站自己的主机做服务器网站如何备案
  • 怎么做二手房网站在网站上做远程教育系统多少钱
  • 政务网站开发方案建一个网站的技术解决方案
  • 学校网站建设招标做网站准备的资料
  • 基本信息型网站有哪些百度app免费下载安装最新版
  • 学校网站网页建设开题报告书wordpress纯代码屏蔽谷歌字体
  • 网站建设实验报告企业seo是什么意思
  • 合肥设计网站公司牡丹江整站优化
  • 佛山网站制作做多少钱网页游戏网址有哪些
  • 注册网站会员违法小微企业生产管理软件
  • 展示型网站与营销型网站区别推广运营策略
  • 做外贸怎么打开国外网站石狮网站建设报价
  • xss网站怎么搭建由wordpress强力驱动
  • 广告网站设计百度指数官网入口登录
  • 沈阳个人网站建设选择做网站遇到的问题及解决方法
  • 在线网站推广工具青岛做网站seo
  • 网站的实现怎么写上海人才网官网登录入口
  • 国外有什么优秀的网站推荐电销系统多少钱一套
  • 百度推广 网站备案网站生成手机端