当前位置: 首页 > wzjs >正文

烂网站做竞价行吗2345网址导航怎么样

烂网站做竞价行吗,2345网址导航怎么样,wordpress 滚动字幕,仿牌外贸网站建设RTX-3090 Qwen3-8B Dify RAG环境搭建 一、环境配置二、操作步骤1、创建容器2、下载`Qwen3-8B`和embedding模型3、安装`transformers`4、安装`vllm`5、安装`flash-attention`6、启动兼容OpenAI API的服务1、方案一:启动`vllm`服务【不支持多任务】2、方案二:Flask和PyTorch实现的…

RTX-3090 Qwen3-8B Dify RAG环境搭建

    • 一、环境配置
    • 二、操作步骤
      • 1、创建容器
      • 2、下载`Qwen3-8B`和embedding模型
      • 3、安装`transformers`
      • 4、安装`vllm`
      • 5、安装`flash-attention`
      • 6、启动兼容OpenAI API的服务
        • 1、方案一:启动`vllm`服务【不支持多任务】
        • 2、方案二:Flask和PyTorch实现的Qwen3-8B和Embeddings 兼容OpenAI API的服务
      • 7、测试API服务
      • 8.安装`Dify`

一、环境配置

属性
CUDA Driver Version555.42.02
CUDA Version12.5
OSUbuntu 20.04.6 LTS
Docker version24.0.5, build 24.0.5-0ubuntu1~20.04.1
GPUNVIDIA GeForce RTX 3090 24GB显存

二、操作步骤

1、创建容器

docker run --runtime nvidia --gpus all -ti \-v $PWD:/home -w /home \-p 8000:8000 --ipc=host nvcr.io/nvidia/pytorch:24.03-py3 bash

2、下载Qwen3-8B和embedding模型

cd /home
pip install modelscope
modelscope download --model Qwen/Qwen3-8B  --local_dir Qwen3-8B
modelscope download --model maidalun/bce-embedding-base_v1 --local_dir bce-embedding-base_v1

3、安装transformers

cd /home
git clone https://github.com/huggingface/transformers.git
cd transformers
git checkout v4.51.0
pip install tokenizers==0.21
python3 setup.py install

4、安装vllm

pip install vllm
pip install flashinfer-python==v0.2.2
python3 -m pip install --upgrade 'optree>=0.13.0'
pip install bitsandbytes>=0.45.3 -i https://pypi.tuna.tsinghua.edu.cn/simple

5、安装flash-attention

git clone https://github.com/Dao-AILab/flash-attention.git
cd flash-attention/
git checkout fd2fc9d85c8e54e5c20436465bca709bc1a6c5a1
python setup.py build_ext
python setup.py bdist_wheel
pip install dist/flash_attn-*.whl

6、启动兼容OpenAI API的服务

1、方案一:启动vllm服务【不支持多任务】
cd /home
export TORCH_CUDA_ARCH_LIST="8.6+PTX"
vllm serve ./Qwen3-8B/ --quantization bitsandbytes --enable-prefix-caching --dtype bfloat16
2、方案二:Flask和PyTorch实现的Qwen3-8B和Embeddings 兼容OpenAI API的服务
cat > dify_api_srv.py <<-'EOF'
from transformers import AutoModelForCausalLM, AutoTokenizer
import time
import torch
from transformers import AutoModel
from typing import List
import numpy as np
from transformers import TextStreamer
from flask import Flask, request, jsonify, Response
import uuid
import jsonapp = Flask(__name__)# 加载模型和分词器
model_name = "./Qwen3-8B"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name,torch_dtype="auto",device_map="auto"
)# 加载本地嵌入模型
MODEL_PATH = "./bce-embedding-base_v1"  # 本地模型路径
rerank_tokenizer = AutoTokenizer.from_pretrained(MODEL_PATH)
rerank_model = AutoModel.from_pretrained(MODEL_PATH)@app.route('/v1/completions', methods=['POST'])
def handle_completion():"""处理文本补全请求"""data = request.get_json()print(data)# 解析请求参数prompt = data.get('prompt', '')max_tokens = data.get('max_tokens', 32768)temperature = float(data.get('temperature', 1.0))top_p = float(data.get('top_p', 1.0))# 构建模型输入messages = [{"role": "user", "content": prompt}]formatted_text = tokenizer.apply_chat_template(messages,tokenize=False,add_generation_prompt=True,enable_thinking=False)inputs = tokenizer(formatted_text, return_tensors="pt").to(model.device)# 生成文本generated_ids = model.generate(**inputs,max_new_tokens=max_tokens,temperature=temperature,do_sample=False,top_p=top_p,pad_token_id=tokenizer.eos_token_id)# 解析生成结果output_ids = generated_ids[0][len(inputs.input_ids[0]):]try:think_token_id = tokenizer.convert_tokens_to_ids("</think>")index = len(output_ids
http://www.dtcms.com/wzjs/114928.html

相关文章:

  • 环保组织的相关信息百度seo官方网站
  • 笑话 语录用什么网站做百度首页登录
  • 有没有什么做海报字体的网站电商培训班
  • 辽宁建设工程信息网辽宁省房屋建筑和市政工程招投标监管平台厦门seo关键词优化培训
  • 网站制作 文案房地产销售工作内容
  • 六安网站建设培训百度网盘电话人工服务
  • 免费网站建设建议西安seo培训机构
  • 上海网站建设怎么样做直销去哪里找客户
  • php做商城网站怎么做好三亚百度推广公司
  • 商城型网站怎么做优化搜索引擎推广法
  • 受欢迎的做网站seo在哪学
  • 网页制作平台不收押金有哪些windows优化大师软件介绍
  • seo关键词优化排名外包seo型网站
  • 北京市住房及城乡建设网站电脑培训班速成班
  • 服务器维护廊坊百度快照优化哪家服务好
  • 惠州做网站的公司全网推广方案
  • 网站图片展示源码最新网站发布
  • 日本建筑网站大数据网络营销
  • 酒店网站设计公司网站seo工具
  • 宁远县建设局网站一网信息一个简单便捷的新闻网站
  • 找外包做网站不给代码seo标题关键词优化
  • 买卖域名的网站免费推广软件 推广帮手
  • t.cn这种网站怎么做的重庆森林为什么不能看
  • 烟台网站排行榜江小白网络营销案例
  • 网站建设方案实例虎扑体育网体育
  • 织梦html5手机网站模板广东全网推广
  • 园艺建设网站竞价排名服务
  • 关于电商网站规划方案网络推广渠道都有哪些
  • 做网站页面代码国内电商平台有哪些
  • 表白网站是怎么做的百度引擎搜索