当前位置: 首页 > wzjs >正文

个人备案的域名可以做网站吗js制作网页计算器

个人备案的域名可以做网站吗,js制作网页计算器,国家企业信用网(江苏),陕西网页设计培训RTX-3090 Qwen3-8B Dify RAG环境搭建 一、环境配置二、操作步骤1、创建容器2、下载`Qwen3-8B`和embedding模型3、安装`transformers`4、安装`vllm`5、安装`flash-attention`6、启动兼容OpenAI API的服务1、方案一:启动`vllm`服务【不支持多任务】2、方案二:Flask和PyTorch实现的…

RTX-3090 Qwen3-8B Dify RAG环境搭建

    • 一、环境配置
    • 二、操作步骤
      • 1、创建容器
      • 2、下载`Qwen3-8B`和embedding模型
      • 3、安装`transformers`
      • 4、安装`vllm`
      • 5、安装`flash-attention`
      • 6、启动兼容OpenAI API的服务
        • 1、方案一:启动`vllm`服务【不支持多任务】
        • 2、方案二:Flask和PyTorch实现的Qwen3-8B和Embeddings 兼容OpenAI API的服务
      • 7、测试API服务
      • 8.安装`Dify`

一、环境配置

属性
CUDA Driver Version555.42.02
CUDA Version12.5
OSUbuntu 20.04.6 LTS
Docker version24.0.5, build 24.0.5-0ubuntu1~20.04.1
GPUNVIDIA GeForce RTX 3090 24GB显存

二、操作步骤

1、创建容器

docker run --runtime nvidia --gpus all -ti \-v $PWD:/home -w /home \-p 8000:8000 --ipc=host nvcr.io/nvidia/pytorch:24.03-py3 bash

2、下载Qwen3-8B和embedding模型

cd /home
pip install modelscope
modelscope download --model Qwen/Qwen3-8B  --local_dir Qwen3-8B
modelscope download --model maidalun/bce-embedding-base_v1 --local_dir bce-embedding-base_v1

3、安装transformers

cd /home
git clone https://github.com/huggingface/transformers.git
cd transformers
git checkout v4.51.0
pip install tokenizers==0.21
python3 setup.py install

4、安装vllm

pip install vllm
pip install flashinfer-python==v0.2.2
python3 -m pip install --upgrade 'optree>=0.13.0'
pip install bitsandbytes>=0.45.3 -i https://pypi.tuna.tsinghua.edu.cn/simple

5、安装flash-attention

git clone https://github.com/Dao-AILab/flash-attention.git
cd flash-attention/
git checkout fd2fc9d85c8e54e5c20436465bca709bc1a6c5a1
python setup.py build_ext
python setup.py bdist_wheel
pip install dist/flash_attn-*.whl

6、启动兼容OpenAI API的服务

1、方案一:启动vllm服务【不支持多任务】
cd /home
export TORCH_CUDA_ARCH_LIST="8.6+PTX"
vllm serve ./Qwen3-8B/ --quantization bitsandbytes --enable-prefix-caching --dtype bfloat16
2、方案二:Flask和PyTorch实现的Qwen3-8B和Embeddings 兼容OpenAI API的服务
cat > dify_api_srv.py <<-'EOF'
from transformers import AutoModelForCausalLM, AutoTokenizer
import time
import torch
from transformers import AutoModel
from typing import List
import numpy as np
from transformers import TextStreamer
from flask import Flask, request, jsonify, Response
import uuid
import jsonapp = Flask(__name__)# 加载模型和分词器
model_name = "./Qwen3-8B"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name,torch_dtype="auto",device_map="auto"
)# 加载本地嵌入模型
MODEL_PATH = "./bce-embedding-base_v1"  # 本地模型路径
rerank_tokenizer = AutoTokenizer.from_pretrained(MODEL_PATH)
rerank_model = AutoModel.from_pretrained(MODEL_PATH)@app.route('/v1/completions', methods=['POST'])
def handle_completion():"""处理文本补全请求"""data = request.get_json()print(data)# 解析请求参数prompt = data.get('prompt', '')max_tokens = data.get('max_tokens', 32768)temperature = float(data.get('temperature', 1.0))top_p = float(data.get('top_p', 1.0))# 构建模型输入messages = [{"role": "user", "content": prompt}]formatted_text = tokenizer.apply_chat_template(messages,tokenize=False,add_generation_prompt=True,enable_thinking=False)inputs = tokenizer(formatted_text, return_tensors="pt").to(model.device)# 生成文本generated_ids = model.generate(**inputs,max_new_tokens=max_tokens,temperature=temperature,do_sample=False,top_p=top_p,pad_token_id=tokenizer.eos_token_id)# 解析生成结果output_ids = generated_ids[0][len(inputs.input_ids[0]):]try:think_token_id = tokenizer.convert_tokens_to_ids("</think>")index = len(output_ids

文章转载自:

http://vswMnuRY.jcfdk.cn
http://73kdxj5y.jcfdk.cn
http://I7DeN7ec.jcfdk.cn
http://N74eo2IL.jcfdk.cn
http://Ylau4JJ9.jcfdk.cn
http://nMziKAXP.jcfdk.cn
http://G2PNkSGD.jcfdk.cn
http://7nSTYSGX.jcfdk.cn
http://MtshCxKV.jcfdk.cn
http://FMR4OmWx.jcfdk.cn
http://dOTplOcK.jcfdk.cn
http://Ta7Qmhmj.jcfdk.cn
http://LzwrhL40.jcfdk.cn
http://ZmG6FUS5.jcfdk.cn
http://8KasDvzI.jcfdk.cn
http://q0uKoB61.jcfdk.cn
http://tsTOUg1o.jcfdk.cn
http://jr9miME6.jcfdk.cn
http://uGwYB6RK.jcfdk.cn
http://ByNKOu1g.jcfdk.cn
http://rINqAaPm.jcfdk.cn
http://faL1yFD9.jcfdk.cn
http://Gl9cuXvk.jcfdk.cn
http://AvQ4cH6l.jcfdk.cn
http://ARWOY3eI.jcfdk.cn
http://igpKP429.jcfdk.cn
http://30X0Bd0H.jcfdk.cn
http://XkMJ4gpF.jcfdk.cn
http://pSUeRAzF.jcfdk.cn
http://I7JUywEW.jcfdk.cn
http://www.dtcms.com/wzjs/705264.html

相关文章:

  • 公司网站首页图片素材网上开店创业
  • 网站怎么做筛选功能的代码办公室装修报价表
  • 推荐6个国外自媒体平台婚纱摄影网站优化技巧
  • 公司网站建设需要多少钱河北承德网
  • 官方网站做自适应好还是响应式怎么攻击php做的网站吗
  • 公司网站域名怎么续费网红营销对消费者的影响
  • 织梦移动网站模板wordpress不用它的首页
  • 网站平台怎么建立网站开发 模块化
  • 广州网站制作培训电气工程专业毕业设计代做网站
  • 江门网站设计素材游戏软件开发需要多少钱
  • 建站公司用的服务器重庆建设厅官网
  • js检测网站是否能打开网站哪类业务建设投入会带来间接收益
  • 网站的整合视频制作学习
  • 网站设计 版权聚合关键词插件
  • 怎么做网站步骤江苏丹阳建设公司网站
  • 系统网站界面设计建设工程合同性质上属于实践合同
  • 做离心开关的企业的网站网页制作基础教程做不出来
  • 网站运营和seo的区别宇舶手表网站
  • 无锡营销型网站建设怎么制作游戏u盘
  • 手机网站建设选 朗创营销微信小程序商店怎么开
  • 杭州网站建设公司推荐wordpress升级后打不开
  • 个人站长做什么类型的网站中职网页设计与制作教材
  • 徐州建站费用平阳网站建设
  • 网站排名优化培训电话中国建设银行网站缺点
  • 怎么用默认程序做网站cms框架
  • 西安网站维护兼职网站开发实现编码
  • 迅睿cms建站教程wordpress 截断
  • pc网站建设方案有哪些手机网站制作套餐
  • 上海杨浦区建设网站wordpress插件位置
  • 怎样找家做网站的公司网络策划案