当前位置: 首页 > wzjs >正文

紫网站建设软文推广收费

紫网站建设,软文推广收费,网上做公益的网站,怎么做网站弹窗文章目录 查找舆情热词 查找舆情热词 将每篇文章处理为两个字符串,一个标题,一个正文串;对所有新闻中出现的词语进行处理,输出出现频率最高的topN个词语作为热词;标题中的词语频率系数为3,正文中词语的频率…

文章目录

  • 查找舆情热词

查找舆情热词

  • 将每篇文章处理为两个字符串,一个标题,一个正文串;
  • 对所有新闻中出现的词语进行处理,输出出现频率最高的topN个词语作为热词;
  • 标题中的词语频率系数为3,正文中词语的频率系数为1,结果按照词语频率从高到低排序,当词语出现频率相同时,在标题中出现的频率次数高的排在前面;若仍相同,则按照词语在标题中的先后顺序排序,如果仍相同,则按照词语在正文中为先后顺序排序;

输入描述:
第一行输入正整数N和文章数M;
后续的2M行,每两行为一篇文章的标题串、正文串;
参数限制如下:
0<N<1000, 0<M<100000, 0<每篇文章的词语数<5000

输出描述:
输出出现频率最高的topN个词语,以空格分隔

示例1
输入:
3 2
xinguan feiyan xinzeng bendi quezhen anli
ju baodao chengdu xinzeng xinguan feiyan bendi quezhen anli yili shenzhen
xinzeng bendi quezhen anli liangli yiqing zhhengti kongzhi lianghao
xinguan yimiao linchuang shiyan
wuzhong xinguan yimiao tongguo sanqi linchuang shiyan xiaoguo lianghao

输出:
xinguan xinzeng bendi

python实现

  • 简单的词语统计;
  • 每个词语包含信息 [词语,[总词频次,标题中词频次,标题顺序,正文顺序]]
  • 正文中的词语在标题中的词频不累加;
  • 标题顺序、正文顺序基于索引表示,且所有标题共用一套索引,所有正文共用一套索引;
  • 总词频降序,标题词频降序,标题顺序升序,正文顺序升序;
  • 取topN

n, m = list(map(int, input().strip().split()))# key为单词,value为数组
# 数组的信息: 单词出现总次数 标题中出现次数 标题中的顺序 正文中的顺序
word_freq = {}
title_order = 0
text_order = 0
for i in range(m):  # 输出m篇文章# 统计标题词频title = input().strip().split()for j in range(len(title)):if title[j] not in word_freq:# 初始化word_freq[title[j]] = [0, 0, title_order, -1]  # 标题中的索引位置# 更新当前单词的信息info = word_freq[title[j]]# 若单词是首先出现在正文中if info[2] == -1:info[2] = title_order# 标题中出现的词语频率系数为3,正文中出现的词语频率系数为1info[0] += 1*3info[1] += 1   # 标题中1 就是1title_order += 1  # 写一个标题位置,索引+1# 其次是正文text = input().strip().split()for j in range(len(text)):if text[j] not in word_freq:word_freq[text[j]] = [0, 0, -1, text_order]info = word_freq[text[j]]if info[3] == -1:info[3] = text_orderinfo[0] += 1  # 总频次 + 1# 正文中的单词在标题中的频次为0text_order += 1# 组织数组
word_list = []
for word in word_freq:word_list.append([word, word_freq[word]])
# 排序   总频率降序,
word_list = sorted(word_list, key=lambda x: (-x[1][0], -x[1][1], x[1][2], x[1][3]))# 输出
output_str = ""
for i in range(n):output_str += str(word_list[i][0]) + " "print(output_str[:-1])
http://www.dtcms.com/wzjs/364001.html

相关文章:

  • 公共服务平台网站建设方案网络营销外包顾问
  • 泰兴做网站口碑营销有哪些
  • p2p网站数据分析怎么做郑州网络营销公司有哪些
  • 拉萨市建设局网站网络营销专业是学什么的
  • 在线做流程图的网站百度收录提交工具
  • 用.net做的网站网站建设及网站推广
  • 成都企业网站建设公司搜狗搜索排名优化
  • 宝宝投票网站怎么做推广教程
  • 群晖做网站服务器seo关键词快速排名介绍
  • 手机网站建设万网湖南网络优化
  • 山东莱州市建设局网站ai智能营销系统
  • 一个网站建设域名的构思长春网站建设平台
  • 谷歌浏览器对做网站有什么好处西安关键词优化排名
  • 企业网站托管电话优化大师免费安装下载
  • 连云港做网站最好seo是什么工作
  • 做网站的有哪些安卓aso关键词优化
  • 免费建站平台哪个稳定拉人头最暴利的app
  • 中国建设银行注册网站东莞seo网络公司
  • 开传奇私服网站怎么做seo推广
  • 公司做网站哪个好湖南百度推广公司
  • 对单位网站的要求百度推广客户端下载
  • wordpress文件系统插件百度关键词优化平台
  • an网站建设品牌营销策划怎么写
  • 福建疫情最新数据消息郑州seo公司排名
  • 做网站用的什么语言福清市百度seo
  • 网站加入wordpress网站seo优化免费
  • 潍坊网站建设500网站设计公司官网
  • wordpress主题销售seo优化报价公司
  • 网站制作最seo教程免费分享
  • 免费怎么制作公司网站网站策划方案案例