当前位置: 首页 > news >正文

安装AI高性能推理框架llama.cpp

基础知识:llama.cpp是什么?

1.下载安装包

通过git下载主干源代码:

git clone --progress --branch master -v "https://github.com/ggml-org/llama.cpp.git" "./llama.cpp"

也可以下载tag源码,例如,下载【Source code [zip]】文件:

https://github.com/ggml-org/llama.cpp/releases/tag/b6123

2.执行编译安装

1)安装前准备

(1)安装前需确认是否已安装curl开发库。执行以下命令,确认curl开发库是否已安装?

  • Ubuntu/Debian
# 检查头文件是否存在
ls /usr/include/x86_64-linux-gnu/curl/curl.h
  • CentOS/RHEL
# 检查头文件是否存在
ls /usr/include/curl/curl.h

如果文件不存在,则说明curl开发库还没有安装好,需要执行以下命令进行安装:

  • Ubuntu/Debian
sudo apt update
sudo apt install libcurl4-openssl-dev  # 或 libcurl4-gnutls-dev
  • CentOS/RHEL
sudo yum install -y libcurl-devel

(2)确认是否支持ccache?

执行以下命令确认是否支持ccache:

ccache --version

如果提示命令不存在,执行以下命令进行安装:

  • Ubuntu/Debian
sudo apt update
sudo apt install ccache
  • CentOS/RHEL
sudo yum install -y ccache

(3)创建编译目录

把下载的离线安装解压后,进入到llama.cpp目录,执行以下命令创建build子目录:

mkdir build

2)编译前检查

再进入build子目录,执行以下命令进行编译安装:

cd build          # 进入构建目录
cmake ..          # 生成构建系统(Makefile)

根据提示解决相关的库依赖问题(由于不同的环境预安装的库存在差异,因此,这里不再一一详细说明)。

3)执行编译命令

执行以下命令进行编译:

make GGML_CUDA=1  # 编译项目,并支持CUDA加速版编译,如果没有nvidia的网卡和CUDA库,请直接使用不带参数的 make 命令。

编译过程会需要些时间,请耐心等候。出现以下提示表示

4)执行安装命令

make install      # 安装

3.验证安装效果

执行以下命令,验证安装效果:

llama-cli --version

如果提示以下信息,表示已安装成功

 如果提示以下信息,则说明要更新系统的动态链接库。

llama-cli: error while loading shared libraries: libllama.so: cannot open shared object file: No such file or directory

更新系统的动态链接库的方法如下:

sudo ldconfig

然后验证更新后的效果:

ldconfig -p | grep libllama

返回以下信息,表示更新成功:

此时,再执行llama-cli --version命令即可看到正确的返回结果了。

http://www.dtcms.com/a/326669.html

相关文章:

  • Untiy_SpriteShape
  • VSCode编辑器常用24款基础插件
  • QT QVersionNumber 比较版本号大小
  • 自主泊车算法
  • OFD一键转PDF格式,支持批量转换!
  • 客户端连接redis,redis如何配置
  • 钓鱼鱼饵制作的方式(红队)
  • 定义短的魔术数字时小心负数的整型提升
  • AIStarter修复macOS 15兼容问题:跨平台AI项目管理新体验
  • 【51单片机数码管循环显示3位数字】2022-10-26
  • Spring Boot文件上传功能实现详解
  • day25-IO
  • gateway进行接口日志打印
  • 刘强东的AI棋局
  • 高并发内存池 内存释放回收(6)
  • 如何生成测试报告
  • 加载模型使用torch_dtype参数来显式指定数据类型
  • 美股期权历史波动率数据研究分析教程
  • 基于STM32单片机超声波测速测距防撞报警设计
  • c# 线程的基础教学(winform 电梯模拟)
  • C9800 ISSU升级
  • 【Java工具】Java-sftp线程池上传
  • ADK[5]调用外部工具流程
  • (附源码)基于Spring Boot的4S店信息管理系统 的设计与实现
  • 每日算法刷题Day61:8.11:leetcode 堆11道题,用时2h30min
  • 【功能测试】软件集成测试思路策略与经验总结
  • HTML应用指南:利用GET请求获取全国vivo体验店门店位置信息
  • 字节后端面经
  • 内网依赖管理新思路:Nexus与CPolar的协同实践
  • Linux-FTP服务器搭建