当前位置: 首页 > news >正文

蒙古网站群建设html做的网站排版导致乱码

蒙古网站群建设,html做的网站排版导致乱码,expedia电子商务网站建设,宿州保洁公司哪家好目录 ■环境准备 ■CPU 版本编译 ■GPU 加速编译(ROCm) ■针对特定 AMD GPU 架构优化 ■使用 CMake 的详细配置 ■验证编译结果 ■常见问题和解决方案 ■运行测试 ■环境准备 系统要求 # Ubuntu/Debian 系统依赖sudo apt update sudo apt inst…

目录

■环境准备

■CPU 版本编译

■GPU 加速编译(ROCm)

■针对特定 AMD GPU 架构优化

■使用 CMake 的详细配置

■验证编译结果

■常见问题和解决方案

■运行测试



■环境准备

  • 系统要求
# Ubuntu/Debian 系统依赖sudo apt update sudo apt install -y build-essential git cmake wget 
# 可选:安装 ROCm(如果需要 GPU 加速)sudo apt install -y rocm-dev rocm-utils
  • 获取源代码
# 克隆官方仓库git clone https://github.com/ggerganov/llama.cpp.gitcd llama.cpp

CPU 版本编译

  • 基础编译
# 创建构建目录mkdir build cd build# 配置 CMakecmake .. -DLLAMA_NATIVE=ON# 编译make -j$(nproc)# 或者使用简化方式cd ..  # 回到项目根目录make
  • 高级编译选项
# 启用 AVX/AVX2 支持(AMD CPU 通常支持)make LLAMA_AVX=1 LLAMA_AVX2=1# 启用 AVX512(如果 CPU 支持)make LLAMA_AVX=1 LLAMA_AVX2=1 LLAMA_AVX512=1# 启用 FMA 支持make LLAMA_FMA=1# 启用所有优化make LLAMA_NATIVE=ON

GPU 加速编译(ROCm)

  • 安装 ROCm 依赖
# 确保 ROCm 已正确安装rocm-smi # 检查 ROCm 状态# 安装额外依赖sudo apt install -y hip-devices-rocm miopen-hip-rocm rccl-rocm
  • 编译支持 GPU 的版本
# 使用 CMake 配置mkdir build-gpu cd build-gpu# 配置 ROCm 支持cmake .. -DLLAMA_HIPBLAS=ON -DCMAKE_C_COMPILER=hipcc -DCMAKE_CXX_COMPILER=hipcc -DAMDGPU_TARGETS=gfx900,gfx906,gfx908,gfx1030# 编译make -j$(nproc)
  • 简化的 GPU 编译方式
# 在项目根目录下make LLAMA_HIPBLAS=1

针对特定 AMD GPU 架构优化

  • 查询 GPU 架构
# 查看 AMD GPU 架构rocminfo | grep gfx# 或者使用rocm-smi --showhw
  • 针对特定架构编译
# 针对 RDNA2 架构 (gfx1030)make LLAMA_HIPBLAS=1 AMDGPU_TARGETS=gfx1030# 针对 RDNA3 架构 (gfx1100, gfx1101, gfx1102)make LLAMA_HIPBLAS=1 AMDGPU_TARGETS=gfx1100,gfx1101,gfx1102# 针对 CDNA 架构 (数据中心 GPU)make LLAMA_HIPBLAS=1 AMDGPU_TARGETS=gfx908,gfx90a

使用 CMake 的详细配置

# 创建构建目录mkdir build-amd cd build-amd# 完整的 CMake 配置示例cmake .. -DCMAKE_BUILD_TYPE=Release -DLLAMA_NATIVE=ON  -DLLAMA_HIPBLAS=ON -DLLAMA_AVX=ON -DLLAMA_AVX2=ON -DCMAKE_C_COMPILER=hipcc  -DCMAKE_CXX_COMPILER=hipcc  -DAMDGPU_TARGETS=gfx1030,gfx1100,gfx908# 编译make -j$(nproc)

如何确认 AMDGPU_TARGETS 值

方法一:使用 rocminfo 命令

# 查询 GPU 架构信息rocminfo | grep gfx# 更详细的输出rocminfo | grep -A 5 "Name:"# 示例输出:# Name: gfx906# Name: gfx1030

方法二:使用 rocm-smi 命令

# 显示 GPU 硬件信息rocm-smi --showhw# 显示更详细的 GPU 信息rocm-smi -a | grep "GPU Family"

验证编译结果

  • 检查生成的二进制文件
# 查看生成的可执行文件ls -la main quantize server# 检查二进制文件信息file main# 查看依赖库ldd main 
  • 测试 GPU 支持
# 检查是否支持 GPU 加速./main --help | grep -i gpu# 查看系统信息./main --list-gpus

常见问题和解决方案

  • 编译错误处理
# 如果遇到 HIP 编译错误export HIP_PLATFORM=amdexport HCC_AMDGPU_TARGET=gfx1030 # 根据你的 GPU 架构调整# 如果链接错误export LD_LIBRARY_PATH=/opt/rocm/lib:$LD_LIBRARY_PATH
  • 性能优化设置
# 设置 GPU 内存分配策略export HSA_XNACK=1export MIOPEN_USER_DB_PATH=/tmp/miopen

运行测试

  • CPU 推理测试
# 下载模型(例如 7B 模型)wget https://huggingface.co/TheBloke/Llama-2-7B-GGUF/resolve/main/llama-2-7b.Q4_K_M.gguf# 运行推理./main -m llama-2-7b.Q4_K_M.gguf -p "Hello, how are you?" -n 128
  • GPU 推理测试
# 使用 GPU 运行推理./main -m llama-2-7b.Q4_K_M.gguf -p "Hello, how are you?" -n 128 -ngl 33

至此,本文的内容就结束了。

http://www.dtcms.com/a/568461.html

相关文章:

  • 【国产桌面操作系统】QT应用打deb包
  • React 12
  • 做网站 怎么发布专业模板建站哪家好
  • JavaSe—Set集合
  • 单调栈的“近亲”:用 O(n) 的「单调队列」征服「滑动窗口最大值」
  • Buildroot构建Linux系统根文件系统
  • 在自动驾驶数据闭环中的特征工程应用(上)
  • 【具身智能】Spatial Forcing 论文笔记 如何隐式地为 VLA 注入 3D 空间感知能力
  • 多模态技术深度探索:融合视觉与语言的AI新范式
  • 自动化单mysql多实例库的全量迁移脚本-v2版本
  • [CARLA系列--04]如何在Carla中去调用传感器模型--相机篇
  • 【ASP.NET MVC 进阶】DataAnnotations 特性验证全解析:从基础到避坑,让数据校验像 “安检“ 一样靠谱
  • 做ppt兼职的网站有哪些北京中燕建设公司网站
  • webgl 顶点、片元着色器传参,绘制彩色三角形
  • 实验室安全教育与管理平台学习记录(八)特种设备安全
  • 浙江网站制作国外翻墙设计网站
  • 《神经网络与深度学习》学习笔记一
  • 超越蓝牙与Wi-Fi,UWB技术如何解锁手机下一波创新浪潮?
  • 【VPX650G】基于 VPX 系统架构的 JFM9VU13P FPGA+JFMQL100TAI 超宽带信号处理平台
  • 软考 系统架构设计师系列知识点之杂项集萃(190)
  • Linux信号(下):信号保存和信号处理
  • 仅需一部智能手机,在NVIDIA Isaac Sim中重建真实场景:终极实战指南
  • Spring设计模式刨根问底
  • 河南郑州做网站汉狮网站赚钱的方式
  • 不是万维网的网站如何注册公司抖音号
  • AI 赋能科研实践:从选题到发表的技术重构之路
  • 技术的秩序:IT资产与配置管理的现代重构
  • 告别布线噩梦:8公里LoRa边缘网关如何重构工业物联边界
  • Python 图像处理利器:Pillow 深度详解与实战应用
  • 【数据结构】:二叉树——顺序结构,链式结构的实现及相关操作