当前位置: 首页 > news >正文

娱乐公司网站模板西安市网站搭建

娱乐公司网站模板,西安市网站搭建,做食品外贸选哪个网站好,wordpress utf8 下载使用本地部署的 Ollama Qwen3:14b 模型,结合 BERTopic 输出的关键词与样本摘要,自动生成 3–4 个词的主题名称。整个流程自动化、可复用,适用于学术论文、新闻聚类、客户反馈分析等多种场景。实现思路 我们设计了一个简单的 Python 函数 gen…

使用本地部署的 Ollama + Qwen3:14b 模型,结合 BERTopic 输出的关键词与样本摘要,自动生成 3–4 个词的主题名称。整个流程自动化、可复用,适用于学术论文、新闻聚类、客户反馈分析等多种场景。


实现思路

我们设计了一个简单的 Python 函数 generate_topic_name(),它接收两个参数:

  • topic_keywords:由 BERTopic 生成的当前主题关键词列表;
  • sample_abstracts:属于该主题的若干样本摘要(用于提供上下文)。

函数构造一个清晰的提示词(prompt),调用本地 Ollama 模型进行推理,并对输出结果进行后处理,移除模型可能生成的 <think>...</think> 思考标签(常见于 Qwen 系列模型),最终返回干净的主题名称。


代码详解

import ollama
import redef remove_thinking_tags(text):"""移除所有 <think>...<think> 标签及其内部内容(支持跨行)"""pattern = r'<think>.*?</think>'cleaned = re.sub(pattern, '', text, flags=re.DOTALL)return cleaned.strip()def generate_topic_name(topic_keywords, sample_abstracts):prompt = f""" /no_thinkingYou are a helpful assistant for naming topics from research paper abstracts.
Given the following keywords generated using BERTopic and sample abstracts, generate a short and meaningful topic name.The topic name should be very short, maximum of 3 to 4 words — not a sentence or description.Keywords: {', '.join(topic_keywords)}Abstracts:
{chr(10).join(f"- {abs}" for abs in sample_abstracts)}Give a concise 3–4 word topic name:"""response = ollama.chat(model='Qwen3:14b',messages=[{'role': 'user', 'content': prompt}],options={'temperature': 0.7,'num_predict': 3000  # 类似 max_tokens})raw_content = response['message']['content'].strip()# 清理 thinking 标签内容cleaned_content = remove_thinking_tags(raw_content)return cleaned_contentrenamed_topics = {}for entry in llm_input:name = generate_topic_name(entry["topic_keywords"], entry["sample_abstracts"][:5])renamed_topics[entry["topic_num"]] = nameprint(f"Topic {entry['topic_num']}: {name}")
http://www.dtcms.com/a/466836.html

相关文章:

  • 做网站运用的软件郑州百姓网免费发布信息网
  • Ansible安装及模块
  • 揭阳网站建设公司全民建网站
  • 哪些网站可以做调查赚钱wordpress服务器镜像
  • AI + 区块链开发实战:3 大技术方向 + 5 个落地案例,解锁去中心化网络效能密码
  • 安阳网站建设方案自己做社交网站吗
  • Linux之curl常用参数介绍
  • 唐山seo网站建设提供网页制作平台的公司
  • 南阳市网站建设专利申请
  • 芜湖有哪些招聘网站阿里巴巴吧做网站
  • 网站做优化按点击收费做网站给韩国卖高仿
  • 做网站销售经常遇到的问题智能建站网站
  • Lambda表达式
  • SD12C.TCT瞬态电压抑制(TVS)二极管Semtech升特 电子元器件IC解析
  • wordpress后台添加导航珠海网络排名优化
  • nftables 是什么
  • 基于AD9361的天气雷达回波模拟与硬件系统(三)
  • Fast AutoAugment
  • wordpress 主题 小众百度整站优化
  • Linux内核驱动-Linux系统移植
  • Python人脸检测
  • 鱼骨建站公司专业高端网站设计首选
  • 大模型前世今生(十一):信息论——信息准确传输的上限
  • 马云做中国最大的网站产品开发管理系统
  • 教程网站后台密码石家庄市网站制作价格
  • day94—树—平衡二叉树判断(LeetCode-110)
  • 前端页面渲染方式梳理
  • Linux命令之ping用法
  • 怎么自己做五合一网站旅游短租公寓网站建设
  • 飞凌嵌入式ElfBoard-Linux系统基础入门-网络相关shell命令