当前位置: 首页 > news >正文

不用写代码,批量下载今日头条文章导出excel和pdf

前几天有人问我怎么批量抓取今日头条某个号的所有文章数据,需要文章链接,标题和时间,但是不会写代码,于是我写了个简单的教程

图片

这里以渤海小吏为例 

图片

首先用edge浏览器安装web-scraper浏览器扩展

图片

然后打开浏览器控制台,找到web-scraper, import sitemap,复制以下代码:

 

图片

点击scrape开始抓取 。

图片

导出excel效果如图,包含文章链接,文章标题,文章阅读数,文章评论数,文章发布时间,效果见网盘 https://pan.quark.cn/s/949ca3387267

图片

如果要抓取其他号的文章,修改edit metadata里的链接,你学会了吗?

图片

后续可以将所有文章下载合并成一个pdf文件,大小97MB,左侧是文章目录,点击可跳转到对应文章,效果见网盘 https://pan.quark.cn/s/949ca3387267

图片

图片

图片

当然web-scraper也支持抓取其他网站的数据,掌握点网页知识就可以。

相关文章:

  • vue+elementui 实现上传文件/导入文件的功能
  • 播放器系列4——PCM重采样
  • 今天来介绍和讨论 AGI(通用人工智能)
  • STM32标准库代码详解之GPIO
  • 记录linux安装mysql后链接不上的解决方法
  • 代码随想录算法训练营第三十九天|01背包问题 二维、 01背包问题 一维、416. 分割等和子集
  • 通往 AI 之路:Python 机器学习入门-概率与统计
  • 计算机毕业设计SpringBoot+Vue.js乐享田园系统(源码+文档+PPT+讲解)
  • 大模型时代下的数据标注革命:工具、挑战与未来趋势
  • Pywinauto Recorder: 将Windows操作转化为Python脚本,高效简易地实现操作自动化
  • 测试人员如何更好的跟踪BUG
  • 【C++】2.2.2 变量声明和定义的关系
  • devDependencies和dependencies的区别
  • 12、算法
  • 实时语义分割之FarSeeNet(2020)模型解析代码复现及滑坡检测实战
  • Linux----网络通信
  • WPS AI+office-ai的安装、使用
  • Linux查看TP6 command定时任务并重启
  • 一、Prometheus架构
  • table 拖拽移动
  • 喀什百度做网站多少钱/360收录批量查询
  • 成都做营销型网站/南宁今日头条最新消息
  • 网站左侧导航代码/网站建设多少钱
  • 360doc 网站怎么做/精准客户资源购买
  • 济南做外贸的网站公司吗/44555pd永久四色端口
  • 建设外汇网站/有别人的交易链接怎么交易