当前位置: 首页 > wzjs >正文

大气蓝色律师网站phpcms模板关键词点击价格查询

大气蓝色律师网站phpcms模板,关键词点击价格查询,网站建设专家论证会,企业查查网官网大家好,我是java1234_小锋老师,最近写了一套【NLP舆情分析】基于python微博舆情分析可视化系统(flaskpandasecharts)视频教程,持续更新中,计划月底更新完,感谢支持。今天讲解架构搭建 视频在线地址: 2026…

大家好,我是java1234_小锋老师,最近写了一套【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts)视频教程,持续更新中,计划月底更新完,感谢支持。今天讲解架构搭建

视频在线地址:

2026版【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts+爬虫) 视频教程 (火爆连载更新中..)_哔哩哔哩_bilibili

课程简介:


本课程采用主流的Python技术栈实现,Mysql8数据库,Flask后端,Pandas数据分析,前端可视化图表采用echarts,以及requests库,snowNLP进行情感分析,词频统计,包括大量的数据统计及分析技巧。

实现了,用户登录,注册,爬取微博帖子和评论信息,进行了热词统计以及舆情分析,以及基于echarts实现了数据可视化,包括微博文章分析,微博IP分析,微博评论分析,微博舆情分析。最后也基于wordcloud库实现了词云图,包括微博内容词云图,微博评论词云图,微博评论用户词云图等功能。

微博类别信息爬取

再爬取微博之前,我们先把所有微博类别爬取,再遍历每个类别,爬取微博内容。

访问微博首页:Sina Visitor System 打开谷歌开发者工具或者F12直接快捷打开

点热门推荐,我们可以直观的看到所有的微博类别。

通过分析,我们找到微博类别的请求接口:https://weibo.com/ajax/feed/allGroups

继续分析:接口返回数据的的groups下的第3和第4个下标值正好是所有的微博数据。

实现代码:

"""https://weibo.com/ajax/feed/allGroups微博类别 爬虫代码 以及存到csv文件中
"""
import csv
import os.pathimport numpy as np
import requestsdef init_csv():"""初始化操作,判断csv文件是否存在,不能存在就创建一个:return:"""if not os.path.exists('arcType_data.csv'):  # 不存在就创建一个with open('arcType_data.csv', 'w', encoding='utf8',newline='') as file:  # newline=''参数,参数用于控制换行符的行为 这表示禁用自动换行符转换,即写入文件时使用原始的换行符(例如\r\n或\n)。这对于处理CSV文件时避免不必要的空行特别有用。writer = csv.writer(file)writer.writerow(['类别标题(title)','分组id(gid)','分类id(containerid)'])def getJsonHtml(url, params):"""请求获取Html内容 json数据:param url::param params::return:"""headers = {'user-agent': "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36",'cookie': "UOR=www.baidu.com,s.weibo.com,www.baidu.com; SINAGLOBAL=147269028916.96313.1738405722917; SCF=Aq_smbP0Qulm3aIQiWHRj0MVjLlLvMzPjh08C1UOgzZGKmgtkj3RlIKkPpPunA-Yp4Vs3PxaE2Mnw4EfY-zo22k.; ULV=1746148684228:3:1:1:750370364305.8235.1746148684180:1743395262982; SUBP=0033WrSXqPxfM725Ws9jqgMF55529P9D9WWdhwhTipHbo3gGv6wzaRcu5JpX5KMhUgL.Foef1hMR1KqEeoz2dJLoI08ZqP9yi--NiKLsi-2fi--Ri-8siKnci--fiKnRiKnci--Xi-iWi-8Fi--Ni-i2iK.p; XSRF-TOKEN=jkBbdfx8ioL49wGmuLw8ZTv2; ALF=1754794282; SUB=_2A25FdAx5DeRhGeVL41UZ-SjOyT6IHXVmCAGxrDV8PUJbkNAbLWfskW1NTBTNHVQQjZ8TTBpAQ68hUItVd4KUD_CC; WBPSESS=_IA_wwSTTkx7cB4s0X9svEMSaQHgjmYl9nytbvfrAcd7Iosa-3IBWF4ACq_6aV-rM8H92uAEfJAtiOQKdY2Gha_-gW_mgEBLLJLDTNTrl4COyaKsVhMD_fKgQcz8yS4cNe68un-DHcy9a6K983O71w=="}response = requests.get(url, headers=headers, params=params)if response.status_code == 200:return response.json()else:return Nonedef writeToCsv(row):"""写入csv操作 a操作 尾部追加 写入操作:param row::return:"""with open('arcType_data.csv', 'a', encoding='utf8',newline='') as file:writer = csv.writer(file)writer.writerow(row)def parseJson(json):"""解析Json数据:param json::return:"""arcTypeList = np.append(json['groups'][3]['group'], json['groups'][4]['group'])print(arcTypeList)for arcType in arcTypeList:arcType_title = arcType['title']gid = arcType['gid']containerid = arcType['containerid']writeToCsv([arcType_title, gid, containerid])def start():init_csv()url = 'https://weibo.com/ajax/feed/allGroups'jsonHtml = getJsonHtml(url, {})print(jsonHtml)parseJson(jsonHtml)if __name__ == '__main__':start()

运行后,生成srcType_data.csv文件,里面数据也无误。

http://www.dtcms.com/wzjs/386772.html

相关文章:

  • wordpress页脚链接北京seo网站优化培训
  • 做牙科设计的网站可免费投放广告的平台
  • 如何进行网站性能优化?买外链网站
  • 徐城乡建设局网站疫情放开最新消息今天
  • 怎么做网站推广的论文网络营销人员招聘
  • 长安响应式网站建设百度移动点击排名软件
  • 网站设计中国内优秀企业网站欣赏南宁网络推广培训机构
  • 濮阳网站建设通图片品牌运营策划
  • 建设企业网站电话技术优化seo
  • 做网站页面大小多大优化营商环境发言材料
  • 北京高端网站微信软文案例
  • 网站建设开发价格青岛网站建设培训学校
  • 做720效果的还有哪个网站什么是软文推广
  • 网站地图怎么做一键导航宣传营销方式有哪些
  • 网站外包建设百度指数批量
  • 新手seo网站做什么类型好网页做推广
  • 苏州淘宝运营培训自媒体seo优化
  • 岳阳网站建设制作网站买卖交易平台
  • 网站关键词怎么改seo算法
  • 制作网站模板教程app推广策略
  • 建设网站培训百度关键词指数查询
  • 外贸网站定做营销策略的重要性
  • 遵义网站建设深圳关键词优化怎么样
  • 珠海网站seoseo线上培训多少钱
  • 在哪下载免费的英文版网站模板网站关键词优化价格
  • 网站优化公司哪家效果好个人网页设计作品欣赏
  • 做外贸的专业网站项目推广网站
  • 汽车之家网站是谁做的网站设计公司多少钱
  • 鼠标滚轮翻页网站模板百度手机
  • 5118网站的功能找人帮忙注册app推广