当前位置: 首页 > news >正文

化学专业大型语言模型——SparkChemistry-X1-13B本地部署教程:洞察分子特性,精准预测化学行为

一、模型介绍

iFLYTEK Spark Chemistry-X1-13B 是由 iFLYTEK 团队开发的化学专业大型语言模型。该模型在多种化学任务数据集上对 iFLYTEK Spark-X1 基础模型进行了微调,展示了在解决复杂化学问题方面的卓越能力,同时保持了强大的通用能力。该模型在与化学相关的基准测试中表现出色,并且在大多数评估指标上明显优于领先的通用模型。

主要特点

  • 深度推理架构 :结合长链思维(CoT)和双过程理论的统一框架,支持快速(反应式)和慢速(深思熟虑)两种思考模式
  • 混合训练稳定性 :新颖的注意力掩码机制将不同推理模式的训练阶段解耦,防止数据分布之间的干扰
  • 化学领域增强 :针对以下专业任务的多阶段优化:
    • 高级知识问答
    • 化学名称转换
    • 分子属性预测

模型概要

参数
总参数13B
上下文长度32K
窗口长度32K
层数40
注意力隐藏维度5120
注意力头数40
词汇量130K
注意力机制GQA
激活函数GeLU

评估结果

粗体 = 全球最佳

任务指标Spark Chemistry-X1-13BDeepSeek-R1Gemini 2.5 proGPT-4.1O3-mini
高级知识问答准确率84.0077.0064.0076.0080.00
名称转换准确率71.006.0015.004.006.00
属性预测准确率85.3341.7351.1951.6667.58

评估说明 :

  1. 所有结果显示零样本性能平均值
  2. 对所有模型应用一致的评估协议
  3. DeepSeek-R1、Gemini 2.5 Pro、GPT-4.1 和 O3-mini 使用链式思维(CoT)推理并通过 API 验证进行评估
  4. Spark Chemistry-X1-13B 在 NVIDIA A800 80GB GPU 的本地环境中使用链式思维(CoT)推理进行评估
  5. 评估数据集是自行构建的

二、模型部署

1.下载模型及文件

下载地址:https://modelscope.cn/models/iflytek/Spark-Chemistry-X1-13B/files

下载命令

pip install modelscope
modelscope download --model iflytek/Spark-Chemistry-X1-13B

2.安装环境

cd iflytek/Spark-Chemistry-X1-13B
pip install -r requirements.txt
pip install .

3.快速使用

from modelscope import AutoModelForCausalLM, AutoTokenizer
import torch
# Load model and tokenizer
model_name = "iflytek/Spark-Chemistry-X1-13B"
tokenizer = AutoTokenizer.from_pretrained(model_name,trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(model_name,torch_dtype=torch.float32,device_map="auto",trust_remote_code=True
)
# Reactive
chat_history = [{"role" : "user","content" : "请回答下列问题:高分子材料是否具有柔顺性主要决定于()的运动能力。\nA、主链链节\nB、侧基\nC、侧基内的官能团或原子?"}]inputs = tokenizer.apply_chat_template(chat_history,tokenize=True,return_tensors="pt",add_generation_prompt=True
).to(model.device)outputs = model.generate(inputs,max_new_tokens=8192,top_k=1,do_sample=True,repetition_penalty=1.02,temperature=0.7,eos_token_id=5,pad_token_id=0,
)response = tokenizer.decode(outputs[0][inputs.shape[1] :],skip_special_tokens=True
)
print(response)
from modelscope import AutoModelForCausalLM, AutoTokenizer
import torch
# Load model and tokenizer
model_name = "iflytek/Spark-Chemistry-X1-13B"
tokenizer = AutoTokenizer.from_pretrained(model_name,trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(model_name,torch_dtype=torch.float32,device_map="auto",trust_remote_code=True
)
# Deliberative
chat_history = [{"role" : "system","content" : "请你先深入剖析给出问题的关键要点与内在逻辑,生成思考过程,再根据思考过程回答给出问题。思考过程以<unused6>开头,在结尾处用<unused7>标注结束,<unused7>后为基于思考过程的回答内容"},{"role" : "user","content" : "请回答下列问题:高分子材料是否具有柔顺性主要决定于()的运动能力。\nA、主链链节\nB、侧基\nC、侧基内的官能团或原子?"}]inputs = tokenizer.apply_chat_template(chat_history,tokenize=True,return_tensors="pt",add_generation_prompt=True
).to(model.device)outputs = model.generate(inputs,max_new_tokens=8192,top_k=1,do_sample=True,repetition_penalty=1.02,temperature=0.7,eos_token_id=5,pad_token_id=0,
)response = tokenizer.decode(outputs[0][inputs.shape[1] :],skip_special_tokens=True
)
print(response)

可选:将 FP32 权重转换为 BF16

发布的 Spark Chemistry-X1-13B 权重以 FP32 精度存储。 为了提高推理效率,用户可以选择将权重转换为 bfloat16 (BF16) 格式。

from modelscope import AutoModelForCausalLM
import torchmodel_name = "iflytek/Spark-Chemistry-X1-13B"# Load FP32 weights
model = AutoModelForCausalLM.from_pretrained(model_name,torch_dtype=torch.float32, # explicitly FP32device_map="auto",trust_remote_code=True
)# Convert to BF16
model = model.to(torch.bfloat16)#  Save BF16 weights for later fast loading
save_path = "./Spark-Chemistry-X1-13B-bf16"
model.save_pretrained(save_path, safe_serialization=True)
http://www.dtcms.com/a/422489.html

相关文章:

  • qt5下载
  • c 网站开发代码wordpress调用副标题
  • vscode 不能跳转 ERR_OSSL_EVP_BAD_DECRYPT
  • 大数据毕业设计选题推荐-基于大数据的全球产品库存数据分析与可视化系统-大数据-Spark-Hadoop-Bigdata
  • GitPuk入门到实战(4) - 如何进行分支管理
  • 基于AC6351D2做无线键盘
  • 【STM32项目开源】基于STM32的智能路灯控制系统
  • 超越编辑器:IntelliJ IDEA,如何成为Java开发的智慧引擎
  • Day31_【 NLP _1.文本预处理 _(2)文本张量表示方法】
  • UNIX下C语言编程与实践3-Vi 编辑器从入门到精通:快捷键使用与高效编辑技巧
  • 网站 设计 案例 简单易订货小程序怎么收费
  • 锂离子扩散能垒计算如何驱动高性能电池研发-测试GO
  • rtsoft 的“整理”流程
  • C++程序设计上机作业(1)
  • 【C++STL :vector类 (一) 】详解vector类的使用层vector实践:算法题
  • 机器学习项目结构目录的构建
  • 2022 年 CSP-J(中国计算机学会软件能力认证入门级)初赛真题与答案解析
  • 常州市建设工程网站衡水做网站
  • 北京58网站建设wordpress在线商城插件
  • 2025年计算机网络与信号处理国际会议(CNSP 2025)
  • 利用css的动画效果制作轮播图
  • docker镜像和
  • CSS通用优惠券样式
  • STM32F1学习——CAN外设(上)
  • Docker Desktop实战、问题记录
  • 《 Linux 点滴漫谈: 二 》全面掌握 Linux 系统安装与环境准备,迈出学习第一步
  • 从0死磕全栈之Next.js 中的 CSS 方案全解析:Global CSS、CSS Modules、Tailwind CSS 怎么选?
  • 先域名 还是先做网站蜘蛛搜索引擎
  • 《C++进阶之C++11》【可变参数模板 + emplace接口 + 新的类功能】
  • 什么网站可以做兼职怎么做提卡网站