当前位置: 首页 > wzjs >正文

做网站的软件叫81什么来着网络营销试卷

做网站的软件叫81什么来着,网络营销试卷,专门做简历的网站有哪些,适合个人网站的名称准备工作 pip install gensim jieba markdown scikit-learngensim: Doc2Vec 的核心库。jieba: 中文分词库,处理中文文档必不可少。markdown: 用于将Markdown文档转换为纯文本,以便Doc2Vec处理。scikit-learn: 用于计算文档相似度。步骤 数据预处理: 加载Markdown文档并进行预…

准备工作

pip install gensim jieba markdown scikit-learn
  • gensim: Doc2Vec 的核心库。
  • jieba: 中文分词库,处理中文文档必不可少。
  • markdown: 用于将Markdown文档转换为纯文本,以便Doc2Vec处理。
  • scikit-learn: 用于计算文档相似度。

步骤

  1. 数据预处理: 加载Markdown文档并进行预处理,包括分词、去除停用词等。
  2. 训练Doc2Vec模型: 使用预处理后的文档训练Doc2Vec模型,生成文档向量。
  3. 相似度计算: 使用训练好的模型计算文档之间的相似度。
  4. 结果展示: 展示相似度最高的文档及其相似度分数。

引入依赖

import os
import jieba
import re
from gensim.models.doc2vec import Doc2Vec, TaggedDocument
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import classification_report
import markdown

根据输入的Markdown文档目录加载和预处理文档

目录如图所示

在这里插入图片描述

# --- 1. 数据收集与预处理 ---def load_and_preprocess_markdown_documents(data_dir):"""加载指定目录下所有Markdown文档,进行预处理(去除Markdown语法、分词)。假设每个子文件夹代表一个类别。"""documents = []labels = []doc_id_counter = 0for category_name in os.listdir(data_dir):category_path = os.path.join(data_dir, category_name)if os.path.isdir(category_path):print(f"Processing category: {category_name}")for filename in os.listdir(category_path):if filename.endswith(".md"):filepath = os.path.join(category_path, filename)with open(filepath, 'r', encoding=
http://www.dtcms.com/wzjs/259511.html

相关文章:

  • 人社门户网站建设方案收录优美图片手机版
  • 我想阻止一个网站要怎么做深圳百度推广属于哪家公司
  • 建设广告网站yoast seo教程
  • 一个网站做两个语言模板可以吗如何制作网站赚钱
  • 南阳哪有做网站公司业务推广方案怎么写
  • 网站域名所有人营销软件代理推广
  • 商城开发网站全网整合营销推广方案
  • 做网站要备案吗全国各城市疫情高峰感染进度
  • 建设网站怎么做seo自然优化排名技巧
  • 做网站需要相机吗在线网站建设平台
  • 外贸网站建设大概多少钱微信朋友圈推广软文
  • 大学生做网站的流程网页制作代码模板
  • 化妆品网站做的好的网络营销的特点
  • 建设系统网站首页班级优化大师免费下载
  • myeclipse做网站更改名字百度在线
  • 登陆wordpress后台淮北seo排名
  • 一个企业是如何做网站建设的怎么自己做一个网站
  • 搜索网站开发背景买外链
  • 源码下载网站源码seo公司是什么
  • 保洁公司用哪些网站做推广做网店自己怎么去推广
  • 网站设计报价是多少钱seo入门版
  • 网站用什么技术做成都门户网站建设
  • 用哪个网站做相册视频文件4a广告公司
  • 网站优化站外链接怎么做百度网络营销app
  • app软件免费模板下载网站直播代运营公司
  • 网站建设的技术风险培训体系
  • wordpress教程主题牡丹江seo
  • 深圳学校网站建设培训优化
  • 美国做跟单社区的网站百度seo排名技术必不可少
  • 上海疫情最新数据消息佛山seo培训机构