当前位置: 首页 > wzjs >正文

烂网站做竞价行吗债务优化是什么意思

烂网站做竞价行吗,债务优化是什么意思,wordpress 编辑主题 保存,天元建设集团有限公司安全管理制度RTX-3090 Qwen3-8B Dify RAG环境搭建 一、环境配置二、操作步骤1、创建容器2、下载`Qwen3-8B`和embedding模型3、安装`transformers`4、安装`vllm`5、安装`flash-attention`6、启动兼容OpenAI API的服务1、方案一:启动`vllm`服务【不支持多任务】2、方案二:Flask和PyTorch实现的…

RTX-3090 Qwen3-8B Dify RAG环境搭建

    • 一、环境配置
    • 二、操作步骤
      • 1、创建容器
      • 2、下载`Qwen3-8B`和embedding模型
      • 3、安装`transformers`
      • 4、安装`vllm`
      • 5、安装`flash-attention`
      • 6、启动兼容OpenAI API的服务
        • 1、方案一:启动`vllm`服务【不支持多任务】
        • 2、方案二:Flask和PyTorch实现的Qwen3-8B和Embeddings 兼容OpenAI API的服务
      • 7、测试API服务
      • 8.安装`Dify`

一、环境配置

属性
CUDA Driver Version555.42.02
CUDA Version12.5
OSUbuntu 20.04.6 LTS
Docker version24.0.5, build 24.0.5-0ubuntu1~20.04.1
GPUNVIDIA GeForce RTX 3090 24GB显存

二、操作步骤

1、创建容器

docker run --runtime nvidia --gpus all -ti \-v $PWD:/home -w /home \-p 8000:8000 --ipc=host nvcr.io/nvidia/pytorch:24.03-py3 bash

2、下载Qwen3-8B和embedding模型

cd /home
pip install modelscope
modelscope download --model Qwen/Qwen3-8B  --local_dir Qwen3-8B
modelscope download --model maidalun/bce-embedding-base_v1 --local_dir bce-embedding-base_v1

3、安装transformers

cd /home
git clone https://github.com/huggingface/transformers.git
cd transformers
git checkout v4.51.0
pip install tokenizers==0.21
python3 setup.py install

4、安装vllm

pip install vllm
pip install flashinfer-python==v0.2.2
python3 -m pip install --upgrade 'optree>=0.13.0'
pip install bitsandbytes>=0.45.3 -i https://pypi.tuna.tsinghua.edu.cn/simple

5、安装flash-attention

git clone https://github.com/Dao-AILab/flash-attention.git
cd flash-attention/
git checkout fd2fc9d85c8e54e5c20436465bca709bc1a6c5a1
python setup.py build_ext
python setup.py bdist_wheel
pip install dist/flash_attn-*.whl

6、启动兼容OpenAI API的服务

1、方案一:启动vllm服务【不支持多任务】
cd /home
export TORCH_CUDA_ARCH_LIST="8.6+PTX"
vllm serve ./Qwen3-8B/ --quantization bitsandbytes --enable-prefix-caching --dtype bfloat16
2、方案二:Flask和PyTorch实现的Qwen3-8B和Embeddings 兼容OpenAI API的服务
cat > dify_api_srv.py <<-'EOF'
from transformers import AutoModelForCausalLM, AutoTokenizer
import time
import torch
from transformers import AutoModel
from typing import List
import numpy as np
from transformers import TextStreamer
from flask import Flask, request, jsonify, Response
import uuid
import jsonapp = Flask(__name__)# 加载模型和分词器
model_name = "./Qwen3-8B"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name,torch_dtype="auto",device_map="auto"
)# 加载本地嵌入模型
MODEL_PATH = "./bce-embedding-base_v1"  # 本地模型路径
rerank_tokenizer = AutoTokenizer.from_pretrained(MODEL_PATH)
rerank_model = AutoModel.from_pretrained(MODEL_PATH)@app.route('/v1/completions', methods=['POST'])
def handle_completion():"""处理文本补全请求"""data = request.get_json()print(data)# 解析请求参数prompt = data.get('prompt', '')max_tokens = data.get('max_tokens', 32768)temperature = float(data.get('temperature', 1.0))top_p = float(data.get('top_p', 1.0))# 构建模型输入messages = [{"role": "user", "content": prompt}]formatted_text = tokenizer.apply_chat_template(messages,tokenize=False,add_generation_prompt=True,enable_thinking=False)inputs = tokenizer(formatted_text, return_tensors="pt").to(model.device)# 生成文本generated_ids = model.generate(**inputs,max_new_tokens=max_tokens,temperature=temperature,do_sample=False,top_p=top_p,pad_token_id=tokenizer.eos_token_id)# 解析生成结果output_ids = generated_ids[0][len(inputs.input_ids[0]):]try:think_token_id = tokenizer.convert_tokens_to_ids("</think>")index = len(output_ids
http://www.dtcms.com/wzjs/421091.html

相关文章:

  • 公司网站的seo优化怎么做百度明星人气榜排名
  • 手机网站开发标准教你如何快速建站
  • php网站建设面试怎么做品牌推广和宣传
  • 腾讯网站建设的基本情况seo诊断优化方案
  • 网站装修用什么软件做传智播客培训机构官网
  • 代做底单的网站windows优化大师收费吗
  • 一起做网站17怎么下单搜索引擎在线观看
  • 网站关于我们示例雅思培训班价格一览表
  • 网站建设后台管理seo怎样才能优化网站
  • 开发网站开发工程师腾讯域名
  • 做自己的网站能赚钱吗百度官方优化软件
  • wordpress头像加载深圳市seo上词多少钱
  • 一个公司备案两个网站怎么注册网站
  • 网站开发研发合同一句话让客户主动找你
  • 网站关键词突然搜不到了百度推广价格表
  • javaweb中网站开发seoul是哪个国家
  • 做网站要那些设备网络推广的目标
  • 公司网站上的员工风采怎么做竞价专员是做什么的
  • 无锡网站建设人员下载百度安装
  • 地方政府门户网站的建设whois查询
  • 维修网站怎么做曲靖seo建站
  • wordpress 会议网站全网最全搜索引擎app
  • 涪陵建设委员会网站seo是哪里
  • 网站制作案例怎么样seo赚钱
  • 网站三级页怎么做域名注册官网免费
  • 网站 成本正规职业技能培训机构
  • 华为做网站重庆做优化的网络公司
  • asp作业做购物网站代码2023最新15件重大新闻
  • 安阳县地图高清全图东莞百度seo新网站快速排名
  • photoshop官方下载湖南seo推广多少钱