当前位置: 首页 > news >正文

网站设计与管理论文有做材料的网站吗

网站设计与管理论文,有做材料的网站吗,阿里云个人网站建设方案书,用织梦做网站快吗解决使用 nltk 的 sent_tokenize, word_tokenize、WordNetLemmatizer 方法时报错问题 第 2 节的手动方法的法1可解决大部分问题,可首先尝试章节 2 的方法 1. nltk.download(‘punkt_tab’) LookupError: *******************************************************…

解决使用 nltksent_tokenize, word_tokenize、WordNetLemmatizer 方法时报错问题

第 2 节的手动方法的法1可解决大部分问题,可首先尝试章节 2 的方法

1. nltk.download(‘punkt_tab’)

LookupError: 
**********************************************************************Resource punkt_tab not found.Please use the NLTK Downloader to obtain the resource:>>> import nltk>>> nltk.download('punkt_tab')For more information see: https://www.nltk.org/data.html  Attempted to load tokenizers/punkt_tab/english/Searched in:- 'C:\\Users\\chenw/nltk_data'- 'D:\\RuanJianAPP\\anaconda3\\envs\\NLP-30820\\nltk_data'- 'D:\\RuanJianAPP\\anaconda3\\envs\\NLP-30820\\share\\nltk_data'- 'D:\\RuanJianAPP\\anaconda3\\envs\\NLP-30820\\lib\\nltk_data'- 'C:\\Users\\chenw\\AppData\\Roaming\\nltk_data'- 'C:\\nltk_data'- 'D:\\nltk_data'- 'E:\\nltk_data'
**********************************************************************

根据提示可手动或自动处理这一报错

1) 运行命令(不是每个人都能成功

your_path 换为你想安装的文件地址(必须是上面所显示的任一路径)

import nltk
nltk.download('punkt_tab', download_dir=your_path)

可以使用一下方法检查 NLTK 数据路径

import nltk
print(nltk.data.find('tokenizers/punkt_tab'))

2) 手动

首先,从官网下载文件

NLTK Corpora: https://www.nltk.org/nltk_data/

在官网页面搜索 punkt_tab ,在第 77 条:Punkt Tokenizer Models [ download | source ] 点击 download 下载。
在这里插入图片描述
之后,(我使用的是提示的第四条路径)在上面提示路径中的任意一个路径中,在 ..../lib 文件夹下新建 nltk_data/tokenizers 文件夹。

然后,将下载的文件解压到 tokenizers 文件夹下:
在这里插入图片描述
最后,试运行一下是不会报错的(只要没有哪一步出错)

2. nltk.download(‘wordnet’)

WordNetLemmatizer().lemmatize()

LookupError: 
**********************************************************************Resource wordnet not found.Please use the NLTK Downloader to obtain the resource:>>> import nltk>>> nltk.download('wordnet')For more information see: https://www.nltk.org/data.htmlAttempted to load corpora/wordnetSearched in:- 'C:\\Users\\chenw/nltk_data'- 'D:\\RuanJianAPP\\anaconda3\\envs\\NLP-30820\\nltk_data'- 'D:\\RuanJianAPP\\anaconda3\\envs\\NLP-30820\\share\\nltk_data'- 'D:\\RuanJianAPP\\anaconda3\\envs\\NLP-30820\\lib\\nltk_data'- 'C:\\Users\\chenw\\AppData\\Roaming\\nltk_data'- 'C:\\nltk_data'- 'D:\\nltk_data'- 'E:\\nltk_data'
**********************************************************************

同样也是分手动和自动,按照上述的方法

1) 运行命令(不是每个人都能成功

punkt_tab 的处理方法类似

import nltk
nltk.download('wordnet', download_dir=your_path)

2) 手动

法1:直接从下面的链接中下载语料库(推荐

nltk_data: https://github.com/nltk/nltk_data

将下载好的包解压,解压后包中 packages 中的所以文件复制到 nltk_data 文件夹中


在这里插入图片描述


在这里插入图片描述


tokenizers\punkt_tab.zip 文件需要解压,之后无关文件可删除

在这里插入图片描述

可参考文章:nltk.download(‘wordnet‘)错误;Resource wordnet not found. Please use the NLTK Downloader to obtain th

法2:与 1. nltk.download('punkt_tab') 的手动操作方法相同

NLTK Corpora 的 114 个压缩包(我没试过,文件太大,下载太慢)

在这里插入图片描述


3. 验证数据包是否下载成功

from nltk.tokenize import word_tokenize
text = "This are some sample sentences to test the tokenizer."
tokens = word_tokenize(text)
print(tokens)
['This', 'are', 'some', 'sample', 'sentences', 'to', 'test', 'the', 'tokenizer', '.']
from nltk import WordNetLemmatizer
lemmatizer = WordNetLemmatizer() # 词形还原器
wordlist = [] # 存储词形还原后单词的列表# 对每个单词进行词形还原
for word in tokens:# 这里默认词性为名词("n"),可以根据需要扩展到其他词性# 例如:使用词性标注工具(如 nltk.pos_tag)来确定单词的词性lemma_word = lemmatizer.lemmatize(word, pos="n")wordlist.append(lemma_word)print(wordlist)
['This', 'are', 'some', 'sample', 'sentence', 'to', 'test', 'the', 'tokenizer', '.']
http://www.dtcms.com/a/501856.html

相关文章:

  • 无锡做智能网站网站建设方案分析
  • 商城网站建设模板下载网站模板打包
  • 网站改进建议新开传奇网站发布站
  • 个人网站注册平台无代码建站软件
  • 沈阳唐朝网站建设怎样开发自己的app
  • 网站服务器基本要素有哪些织梦手机网站模板
  • asp.net不适合做网站叙述网站的建设意义所在
  • 做网站dreamwa东莞如何搭建网站建设
  • 广州 骏域网站建设专家网络规划设计师教程(第2版)pdf
  • 网站建设用什么程序语言wordpress 外贸
  • 做网站用什么技术中文字体怎么设计网站
  • 个人网站开发是学什么语言深圳百度推广开户
  • 网站添加关键字把静态图片做成动态图片的软件
  • 无锡网站优化价格jquery制作简单的网页
  • 交通运输企业标准建设网站东营机关建设网站
  • 杭州网站优化外包管理系统网站开发报价
  • 服务佳的广州网站建设怎么做微信上的网站
  • 咸阳网站建设xymokj建设工程网站新专家入库
  • 大连网站建设在线什么是网站开发技术
  • 提高分辨率网站wordpress网站主机
  • 如何利用源代码做网站外贸展示型网页设计
  • 网站开发合同 doc黄强会见韩国忠清南道知事金泰钦
  • 湖州网站设计公司的别名是intitle 无线网站制作
  • 用vs做网站原型如何策划网络推广方案
  • 公司官方网站建设需要多少钱wordpress在空间
  • 网站建设会用到ppt吗中山网站代运营
  • 网站的功能建设方案只做男生穿搭的网站
  • ext做的网站近几年的网络营销案例
  • 网站建设教程详解无锡高端网站设计公司
  • 导购网站模板免费下载营销策划运营培训机构