当前位置: 首页 > wzjs >正文

南城网站建设公司咨询做网站可以不写代码

南城网站建设公司咨询,做网站可以不写代码,手游制作软件,网站上做旅游卖家要学什么条件环境安装可参照 .safetensors转换成.GGUF-CSDN博客 Llama.cpp是在 CPU 和 GPU 上高效运行 LLM 的好方法。缺点但是,您需要将模型转换为 Llama.cpp 支持的格式,现在是 GGUF 文件格式。在这篇博文中,您将学习如何转换HuggingFace 模型 &#…

 环境安装可参照

.safetensors转换成.GGUF-CSDN博客

Llama.cpp是在 CPU 和 GPU 上高效运行 LLM 的好方法。缺点但是,您需要将模型转换为 Llama.cpp 支持的格式,现在是 GGUF 文件格式。在这篇博文中,您将学习如何转换HuggingFace 模型 (Vicuna 13b v1.5) 到 GGUF 模型。

Llama.cpp 支持以下模型:

  • LLaMA 
  • LLaMA 2 
  • Falcon
  • Alpaca
  • GPT4All
  • Chinese LLaMA / Alpaca and Chinese LLaMA-2 / Alpaca-2
  • Vigogne (French)
  • Vicuna
  • Koala
  • OpenBuddy  (Multilingual)
  • Pygmalion 7B / Metharme 7B
  • WizardLM
  • Baichuan-7B and its derivations (such as baichuan-7b-sft)
  • Aquila-7B / AquilaChat-7B

步骤:

下载模型

参考内网环境下如何快速下载大模型-CSDN博客

转换模型

克隆 llama.cpp 存储库

git clone https://github.com/ggerganov/llama.cpp.git

安装所需的 python 库:

pip install -r llama.cpp/requirements.txt
window下可能会有问题请使用
pip3 install -r llama.cpp/requirements.txt

验证脚本是否存在并了解各种选项:

python llama.cpp/convert.py -h

将 HF 模型转换为 GGUF 模型:

python llama.cpp/convert.py vicuna-hf \--outfile vicuna-13b-v1.5.gguf \--outtype q8_0
# 如果不量化,保留模型的效果
python llama.cpp/convert_hf_to_gguf.py ./qwen2_0.5b_instruct  --outtype f16 --verbose --outfile qwen2_0.5b_instruct_f16.gguf
# 如果需要量化(加速并有损效果),直接执行下面脚本就可以
python llama.cpp/convert_hf_to_gguf.py ./qwen2_0.5b_instruct  --outtype q8_0 --verbose --outfile qwen2_0.5b_instruct_q8_0.gguf

测试可用

查看模型架构

由于模型架构、权重格式有些模型不能转换

查看模型架构:

 在 Hugging Face 模型页面查看

Hugging Face 上的模型通常会在 "Model Card"里描述使用的架构

在模型的 README.mdModel Card 里,通常会有关于架构的信息,例如:

  • base_model: llama-2
  • architecture: transformer
  • 具体使用了 GPT, Llama, Mistral, ViT 还是 BERT 之类的结构。

config.json 文件中查看

如果模型作者没有明确写明架构,可以查看模型的 config.json

  • 在 Hugging Face 模型页面,点击 "Files" 选项卡。
  • 找到 config.json 文件,点击打开。
  • 查找 architectures 字段,例如:
    {"architectures": ["Qwen2ForCausalLM"],"attention_dropout": 0.0,"bos_token_id": 151643,"eos_token_id": 151645,"hidden_act": "silu","hidden_size": 1536,"initializer_range": 0.02,"intermediate_size": 8960,"max_position_embeddings": 32768,"max_window_layers": 28,"model_type": "qwen2","num_attention_heads": 12,"num_hidden_layers": 28,"num_key_value_heads": 2,"rms_norm_eps": 1e-06,"rope_theta": 1000000.0,"sliding_window": 32768,"tie_word_embeddings": true,"torch_dtype": "bfloat16","transformers_version": "4.40.1","use_cache": true,"use_sliding_window": false,"vocab_size": 151936
    }

    这里可以看到 architecturesQwen2ForCausalLM,说明这个模型采用与 LLaMA 相似的 Transformer 解码器架构。

比如:

https://huggingface.co/AIDC-AI/Ovis2-1B 不能转换

https://huggingface.co/Qwen/Qwen2-1.5B-Instruct 能正常转换

参考:

Converting HuggingFace Models to GGUF/GGML | Substratus.AI

将 HuggingFace 模型转换为 GGUF 及使用 ollama 运行 —— 以 Qwen2-0.5B 为例_huggingface gguf-CSDN博客

http://www.dtcms.com/wzjs/814358.html

相关文章:

  • 仿做国外产品网站出路个人做淘宝客网站要备案吗
  • 安徽住房城乡建设厅网站定制公交app下载
  • 营销型网站一个多少钱专业网页制作培训机构
  • 无锡网站建设君通科技公司石家庄网站制作系统
  • 六安哪家做网站好wordpress WP-Wiki
  • 建域名做网站企业网站设计请示
  • 高中男女做那个视频网站官网是什么意思
  • 光学网站建设制作app的公司是什么公司
  • 网站开发必备人员四川建筑信息数据共享平台
  • 高端网站建设服务商上海雍熙网站平台搭建怎么弄的
  • 如果一个网站没有备案安全达标建设网站
  • 自己怎样做公司广告视频网站wordpress删除目录按固定连接
  • 婚庆网站设计说明书广东企业网站模板定制
  • 企业模板建站wordpress一键优化
  • 人力招聘网站建设的简要任务执行书没有做网站地图影响大吗吗
  • 网站建设可自学吗php网站开发费用
  • 网站地图类型网页制作的目的
  • 服装网站建设图石家庄菜谱设计公司
  • 个人旅游网站模版住房和建设部执业资格注册中心网站
  • 免费创建个人商城网站吗苏州关键词优化软件
  • 怎么自己做网站加盟ui设计收费标准
  • 网站数据分析课程手机壳图案设计网站
  • 开贴纸网站要怎么做的软件开发流程八个步骤概要分析
  • php做网站主要怎么布局jsp网站设计
  • 美丽阿坝网站怎么做永顺县建设局网站
  • 做网站默认城市深圳网站平台
  • 常州市网站建设公司阿里云免费域名
  • 竞价排名采用什么计费方式中山网站建设乐云seo模板中心
  • 图片展示网站模板网站建设创新
  • 安徽飞亚建设网站商城网站开发的目的和意义