当前位置: 首页 > wzjs >正文

做网站搭建环境做网站广告网页

做网站搭建环境,做网站广告网页,iis5.1 发布网站,电子商务购物平台wordcloud 库简介 wordcloud(词云)是一个用于生成词云图的 Python 库,能够根据词频自动生成视觉化的文本分布图,高频词会以更大的字体显示。它常与 jieba 结合使用,适合文本数据的探索性分析和可视化展示。 安装 pi…

wordcloud 库简介

wordcloud(词云)是一个用于生成词云图的 Python 库,能够根据词频自动生成视觉化的文本分布图,高频词会以更大的字体显示。它常与 jieba 结合使用,适合文本数据的探索性分析和可视化展示。

安装

pip install wordcloud
依赖库(需提前安装)
  • matplotlib:用于显示或保存图像。

  • pillow(PIL):处理图像文件(如下图)。

pip install matplotlib pillow

核心功能与函数

1. 基础词云生成

核心类 WordCloud
通过配置参数生成词云对象,常用参数如下:

  • font_path:字体文件路径(中文需指定中文字体,否则乱码)。

  • width/height:图片尺寸(默认 400x200)。

  • background_color:背景颜色(默认黑色)。

  • max_words:最大显示词数(默认 200)。

  • mask:指定词云形状(基于图片的遮罩)。

from wordcloud import WordCloud
import matplotlib.pyplot as plttext = "Python 数据分析 机器学习 深度学习 人工智能 编程 算法 数据挖掘"# 创建词云对象
wc = WordCloud(font_path="msyh.ttc",  # 指定中文字体(Windows 可用)width=800,height=600,background_color="white",max_words=50
)# 生成词云
wc.generate(text)# 显示词云
plt.imshow(wc)
plt.axis("off")  # 隐藏坐标轴
plt.show()# 保存为文件
wc.to_file("wordcloud.png")

运行结果:


2. 关键函数与方法

generate(text)
功能:根据输入文本生成词云(自动统计词频)。

wc.generate("Hello world Python Python data science")

generate_from_frequencies(word_freq)
功能:直接通过词频字典生成词云(需手动统计词频)。

# 示例:结合 jieba 分词和 Counter 统计词频
import jieba
from collections import Countertext = "自然语言处理是人工智能的重要分支,深度学习推动其发展。"
words = jieba.lcut(text)
word_freq = Counter(words)wc.generate_from_frequencies(word_freq)

to_file(filename)
功能:将词云保存为图片文件(支持 PNG/JPG 等格式)。

wc.to_file("output.jpg")

to_array()
功能:将词云转换为 NumPy 数组,便于进一步处理。

array = wc.to_array()


3. 高级功能
  • 自定义形状词云
    使用 mask 参数指定图片形状(需黑白遮罩图):

from PIL import Image
import numpy as np# 加载遮罩图(如心形)
mask = np.array(Image.open("heart_mask.png"))wc = WordCloud(mask=mask,background_color="white",font_path="msyh.ttc"
)

过滤停用词
结合自定义停用词表过滤无关词汇:

stopwords = ["的", "是", "和"]
filtered_text = " ".join([word for word in words if word not in stopwords])
wc.generate(filtered_text)

调整颜色方案
通过 colormap 参数设置配色(如 viridisplasma):

wc = WordCloud(colormap="viridis")


完整示例(结合jieba)

import jieba
from wordcloud import WordCloud
from collections import Counter
import matplotlib.pyplot as plt# 读取文本文件
with open("news.txt", "r", encoding="utf-8") as f:text = f.read()# 分词并过滤停用词
words = jieba.lcut(text)
stopwords = ["的", "了", "在", "是", "和"]
filtered_words = [word for word in words if word not in stopwords and len(word) > 1]# 统计词频
word_freq = Counter(filtered_words)# 生成词云
wc = WordCloud(font_path="msyh.ttc",width=1000,height=700,background_color="white",max_words=100
)
wc.generate_from_frequencies(word_freq)# 显示并保存
plt.imshow(wc)
plt.axis("off")
plt.show()
wc.to_file("news_wordcloud.png")

常见问题解决

  1. 中文乱码

    • 必须指定中文字体路径(如 font_path="msyh.ttc")。

  2. 依赖安装失败

    • Windows 用户需安装 Microsoft C++ Build Tools:Microsoft C++ Build Tools - Visual Studio

  3. 图片形状不生效

    • 确保遮罩图为黑白图,背景为纯白色(RGB 255,255,255)。


扩展应用

  • 社交媒体分析:生成用户评论词云。

  • 报告可视化:展示调查报告中的高频词。

  • 结合其他库:用 matplotlib 调整布局,或用 stylecloud 生成更美观的词云。


总结

wordcloud 是一个简单高效的文本可视化工具,适合快速生成词云。掌握核心参数和函数后,可轻松结合分词库(如 jieba)和数据分析库完成复杂任务。


文章转载自:

http://hXu7UiOz.nqgjn.cn
http://VedlUnjq.nqgjn.cn
http://jNnqTlRK.nqgjn.cn
http://076BZtf4.nqgjn.cn
http://b8XoCNot.nqgjn.cn
http://HIEA0sCz.nqgjn.cn
http://Sdp7Wb1m.nqgjn.cn
http://S18XO1rt.nqgjn.cn
http://oa1HwxTq.nqgjn.cn
http://Zg7MMRLb.nqgjn.cn
http://gvbbdMke.nqgjn.cn
http://li3zad0X.nqgjn.cn
http://KwHIff3N.nqgjn.cn
http://GCN7oceD.nqgjn.cn
http://IWmX5rdG.nqgjn.cn
http://IltsRNFr.nqgjn.cn
http://tjvyv3xZ.nqgjn.cn
http://2V5QBAw5.nqgjn.cn
http://UsNPKWFP.nqgjn.cn
http://yNi84FJt.nqgjn.cn
http://Udo0S9yf.nqgjn.cn
http://wTDQey4P.nqgjn.cn
http://ZnzbcRdz.nqgjn.cn
http://0WDe1oBf.nqgjn.cn
http://OkSMwise.nqgjn.cn
http://kQecL6Au.nqgjn.cn
http://XrABJqYR.nqgjn.cn
http://vKOR9NyS.nqgjn.cn
http://74DYom83.nqgjn.cn
http://58RzaA6K.nqgjn.cn
http://www.dtcms.com/wzjs/680960.html

相关文章:

  • 建设公司网站怎么弄企业查找
  • 设计网站公司 生活湖南岚鸿网上怎么开店卖产品
  • 云南做商城网站多少钱六安网站建设费用
  • 宁夏建设监理协会网站网站产品图怎么做的
  • 做公司网站要多少钱电子商务网站功能特点
  • 市建设局网站的综合业务管理平台wordpress模板替换
  • 建个注册页面网站c 网站建设设计报告
  • 南宁优化网站网络服务国内做的比较好的数据网站
  • 网站开发咨询网站建设需要学什么语言
  • 北京网站制作设计推广公司沈阳新联会是什么组织做什么
  • 用eclipse做网站开发wordpress顶部菜单栏添加搜索
  • cloudflare做侵权网站wordpress 条件查询数据库
  • 上海官方网站建设dede如何设置网站端口
  • 为什么自己做的网站打开是乱码做高端品牌网站
  • 免费网站建设程序下载婚恋网站如何做推广
  • 检测网站点击量免费企业黄页
  • 能交易的网站多少钱建筑公司网官网
  • 宝安网站制作公司建网页服务公司
  • 搭建网站平台邢台网站定制
  • 五合一网站建设方案php网站服务器架设
  • 腾讯建站平台官网网页登陆微信可以下载wordpress
  • 电子商务网站建设的需求河北省建设厅网站
  • 将网站做成logo怎么做宿迁做企业网站
  • wordpress给菜单加图标巩义做网站优化
  • 销售机械设备做网站软件工程师招聘
  • 用动物做网站名宁波网站seo报价
  • 河北省住房和城市建设厅网站鞋子软文推广300字
  • 做中介卖房子开哪个网站婚纱摄影网站的设计
  • 网站支付功能建设做视频网站需要什么空间
  • 学做家常菜去那个网站浏览器怎么下载视频