当前位置: 首页 > news >正文

网站技术维护网站开发弹窗制作

网站技术维护,网站开发弹窗制作,网络营销推广公司找哪家,网站建设需要域名还有什么一、使用 vllm 部署 Llama3-8b-Instruct 交互式建模(PAI-DSW)资源地址: https://github.com/vllm-project/vllmvLLM 是一个用于大型语言模型(LLM)推理和服务的快速且易于使用的库。 vLLM 的快速特性包括:…

一、使用 vllm 部署 Llama3-8b-Instruct

在这里插入图片描述

  1. 交互式建模(PAI-DSW)资源地址:
https://github.com/vllm-project/vllm

vLLM 是一个用于大型语言模型(LLM)推理和服务的快速且易于使用的库。

vLLM 的快速特性包括:

  • 先进的服务吞吐量
  • 使用 PagedAttention 高效管理注意力机制的键和值内存
  • 对传入请求进行持续批处理
  • 使用 CUDA/HIP 图快速执行模型
  • 量化技术:GPTQ、AWQ、SqueezeLLM、FP8 KV 缓存
  • 优化的 CUDA 内核

二、下载llama3模型文件

/mnt/workspace路径下执行

mkdir models

/mnt/workspace/models路径下执行

pip install modelscope
git clone https://www.modelscope.cn/LLM-Research/Meta-Llama-3-8B-Instruct.git

使用 SHA-256 算法检查文件(可选)

shasum -a 256 model-00001-of-00004.safetensors
shasum -a 256 model-00002-of-00004.safetensors
shasum -a 256 model-00003-of-00004.safetensors
shasum -a 256 model-00004-of-00004.safetensors

2.1 安装vLLM

conda create -n vllm python=3.10
conda activate vllm
pip install vllm
pip install modelscope

2.2 模型推理

completion模式

  1. 服务部署
python -m vllm.entrypoints.openai.api_server --model /mnt/workspace/Meta-Llama-3-8B-Instruct --dtype auto --api-key 123456
  1. 服务测试 (vllm_completion_test.py
from openai import OpenAI
client = OpenAI(base_url="http://localhost:8000/v1",api_key="123456",)
print("服务连接成功")
completion = client.completions.create(model="/mnt/workspace/Meta-Llama-3-8B-Instruct",prompt="北京是",max_tokens=128,
)
print("### 北京是: ")  
print("Completion result: ", completion)

另外一个terminal窗口执行

conda activate vllm
python vllm_completion_test.py

2.3 chat模式

  1. 服务部署
python -m vllm.entrypoints.openai.api_server --model /mnt/workspace/Meta-Llama-3-8B-Instruct --dtype auto --api-key 123456
  1. 服务测试(vllm_chat_test.py)
from openai import OpenAI
client = OpenAI(base_url="http://localhost:8000/v1",    api_key="123456",
)
print("服务连接成功")
completion = client.chat.completions.create(model="/mnt/workspace/models/Meta-Llama-3-8B-Instruct",messages=[{"role": "system", "content": "你是一位智能助手."},{"role": "user", "content": "中国的首都是哪里?"}],max_tokens = 128,
)
print(completion.choices[0].message)

另外一个terminal窗口执行

python vllm_chat_test.py
http://www.dtcms.com/a/551906.html

相关文章:

  • 做精美ppt网站建设设计项目备案在哪个网站
  • 中国做网站知名的公司wordpress新建文章页面模板
  • 网站公司大全工业互联网平台系统
  • 域名服务商网站运营管理的主要内容有哪些
  • 现在企业需要建设网站吗深圳做企业网站哪家好
  • 网站建设推荐北京华网天下黄埔五屏网站建设
  • 城市介绍网站模板大连市建设网
  • 网站页面统计代码常州网站的优化
  • 个性化企业网站制作公司走着瞧网站 设计
  • 深圳网站搜索上交所大宗交易平台
  • 做网站做系统wordpress 企业网站模板
  • 个人网站如何做流量商城建设
  • php做网站需要什么技术wordpress动态标签
  • 免费建站哪个好校园网站开发需求文字
  • 网站域名邮箱怎么注册vps的网站打不开
  • 湖北荆门建设银行网站asp简单的网站怎么做
  • 手机建网站教程天眼查询官网在线入口
  • 做tcf法语听力题的网站建设一个平台网站需要多少钱
  • 深圳手机网站制作公司排名上海广告公司大全
  • 网站模板带后台 下载中国诗歌网个人网页
  • 前端开发工程师工资深度优化
  • 网站建设目录结构doc做网站软件是什么行业
  • app 门户网站外贸网站和普通网站
  • 网站首页的快照更新慢restful api wordpress
  • 网站首页大图素材企业网络营销现状
  • mip网站设计ui是做什么的
  • 小程序进入公众号seo教程自学网
  • 微网站建设价格四川建设人才网官网查询
  • 做网站的规划和设想昆明软件开发公司
  • 怎么样做手机网站沈阳网站开发公司