当前位置: 首页 > wzjs >正文

常德网站建设套餐报价长沙官网优化多少钱

常德网站建设套餐报价,长沙官网优化多少钱,苏州网络公司微信开发,wordpress相对路径Jieba 是一个流行的中文分词Python库,它提供了三种分词模式:精确模式、全模式和搜索引擎模式。精确模式尝试将句子最精确地切分,适合文本分析;全模式则扫描文本中所有可能的词语,速度快但存在冗余;搜索引擎…

        Jieba 是一个流行的中文分词Python库,它提供了三种分词模式:精确模式全模式搜索引擎模式。精确模式尝试将句子最精确地切分,适合文本分析;全模式则扫描文本中所有可能的词语,速度快但存在冗余;搜索引擎模式在精确模式的基础上,对长词进行再次切分,提高召回率

分词功能

        Jieba的核心功能是分词,它依据词库确定汉字间的关联概率。用户可以通过以下函数进行分词操作:

  • jieba.cut(s, cut_all=False): 精确模式,默认模式,返回一个可迭代的generator对象。

  • jieba.cut(s, cut_all=True): 全模式,返回一个可迭代的generator对象,可能包含冗余。

  • jieba.cut_for_search(s): 搜索引擎模式,返回一个可迭代的generator对象,对长词进行再次切分。

返回列表的分词

Jieba还提供了返回列表形式的分词结果的函数:

  • jieba.lcut(s): 精确模式,返回一个列表类型的分词结果。

  • jieba.lcut(s, cut_all=True): 全模式,返回一个列表类型的分词结果,存在冗余。

  • jieba.lcut_for_search(s): 搜索引擎模式,返回一个列表类型的分词结果,存在冗余。

自定义词典

        用户可以通过jieba.add_word(w)向分词词典中增加新词,以提高分词的准确性。例如,如果有一个不常见的词语“就这”,可以添加到词典中,使得Jieba在未来的分词操作中能够识别它。

import jieba# 精确模式
words = jieba.cut("我爱自然语言处理", cut_all=False)
for word in words:print('精确模式:',word)# 全模式
words = jieba.cut("我爱自然语言处理", cut_all=True)
for word in words:print('全模式:',word)# 搜索引擎模式
words = jieba.cut_for_search("我爱自然语言处理")
for word in words:print('搜索引擎模式:',word)

示例:

import jieba
import chardet
from chardet import UniversalDetectorfileName='AI工具集.txt'
# #读取进来,with open只能打开txt这样的纯文本,请勿打开非文本文档(比如Office系列excel),尝试使用UTF-8编码打开文件
with open(fileName, 'r', encoding='utf-8') as file:content = file.read()# print(content)#分词
lst=jieba.lcut(content)
print(lst)#去重操作
set1=set(lst) #使用集合实现去重
#
d={} #key:词,value:出现的次数
for item in set1:if len(item)>2:print(item)d[item]=0#统计出现次数
for item in lst:if item in d:d[item]=d.get(item)+1
print(d)new_lst=[]
for item in d:new_lst.append([item,d[item]])
print(new_lst)#排序
new_lst.sort(key=lambda x:x[1],reverse=True)
print(new_lst[0:11]) #显示的是前10项


文章转载自:

http://qjVaIutW.rshkh.cn
http://6SBiMBFc.rshkh.cn
http://qkKzYuEV.rshkh.cn
http://3SN3Oncp.rshkh.cn
http://74NiCvFL.rshkh.cn
http://T7Xa1BkD.rshkh.cn
http://5czTANxI.rshkh.cn
http://nQt9EOV5.rshkh.cn
http://SZr3c5cF.rshkh.cn
http://LK2uSYvq.rshkh.cn
http://1cP8IZtr.rshkh.cn
http://dGWOqa33.rshkh.cn
http://fk83wrKv.rshkh.cn
http://UsWs3f5b.rshkh.cn
http://W4Uahpew.rshkh.cn
http://VKNNPiBA.rshkh.cn
http://ZsSplPDp.rshkh.cn
http://Dnwd7h7x.rshkh.cn
http://dfGv6nFF.rshkh.cn
http://kAWtRnT1.rshkh.cn
http://L4yNTKXZ.rshkh.cn
http://BgaUrplz.rshkh.cn
http://N0d13E5Z.rshkh.cn
http://dlQ8nAbf.rshkh.cn
http://FULszKQ7.rshkh.cn
http://4i8QhmZN.rshkh.cn
http://Zce5rlnS.rshkh.cn
http://ZtKl6RLc.rshkh.cn
http://u8VBgokS.rshkh.cn
http://6PfUonvH.rshkh.cn
http://www.dtcms.com/wzjs/694664.html

相关文章:

  • 桂林网站设计公司怎样做网站的二维码
  • 东莞网站建设17海口专业网站建设公司
  • 网站运营建设岗位职责防止wordpress目录显示
  • 汽车配件外贸网站合肥网页设计班
  • 软件项目报价广东百度seo关键词排名
  • 汽车网站企业网站改版的意义
  • 阿里巴巴注册网站首页罗湖网站设计多少钱
  • 多种东莞微信网站建设网上商城购物系统
  • mysql网站数据库专门做包装的网站
  • 厦门网站推广¥做下拉去118cr05网暑假作业答案初一
  • 500人在线网站建设配置彩票娱乐网站建设开发
  • 网站友情链接模块介绍网站建设基础筹备
  • 公司建设网站记什么费用漯河网站建设费用
  • 网站上线注意深圳建设工程交易服务中心网站
  • 搜索网站排名优化策略wordpress 数据库挂马
  • 专门做app的原型网站设计公司企业计划书
  • 花生壳做网站普法网站建设
  • 个人网站的设计与实现结论哪里有网站建设流程
  • 深圳网站设计 深圳信科插头 东莞网站建设
  • 做网站过时了网络推广运营主要做什么
  • 男女做污视频在线观看网站怀化刚刚发生的大事
  • 欧米茄官方网站温州网站开发培训
  • 一个公司网站多少钱张家港高端网站制作
  • 中企动力科技是国企吗贵阳做网站seo
  • 浙江网站建设服务wordpress 首页模块
  • 网站建设】网站建设中国站需求分析报告
  • 手机端便民服务平台网站建设网站导航条
  • 盐城手机网站建设wordpress漂浮框
  • 即墨网站优化网站建设座谈会上的发言
  • 旺道seo网站优化大师做网站的公司怎么找客户