当前位置: 首页 > news >正文

2025年如何批量下载雪球帖子和文章导出pdf?

之前分享过雪球文章下载 2025 批量下载市场高标解读/配置喵/wangdizhe 雪球帖子/文章导出excel和pdf

这里以市场高标解读这个号为例 

图片

抓取下载的所有帖子excel数据包含文章日期,文章标题,文章链接,文章简介,点赞数,转发数,评论数等,第一个帖子发布于2021年  ,评论数最高(3444)的帖子是 ,转发数最高(427)的帖子是 

图片

雪球帖子目录包含发布时间和标题,点击跳转到对应帖子。

图片

下载的所有帖子内容html:

图片

下载的所有帖子内容pdf:

图片

最后合并成一个pdf文件,大小173MB,效果见网盘 https://pan.quark.cn/s/a95c2f5494ea 

图片

点击左侧书签可以跳转到对应帖子。

图片

还有狂龙十八段这个号 

图片

下载所有帖子html内容:

图片

用我开发的pdf工具批量转换为pdf   苏生不惑开发过的软件工具整理

图片

图片

最后将所有pdf 合并为一个带书签的pdf文件,大小148MB,效果见网盘 https://pan.quark.cn/s/a95c2f5494ea

图片

图片

点击左侧书签目录可跳转到对应帖子。

图片

顺便导出所有帖子excel,数据包含雪球链接,时间,评论数,点赞数,转发数等。

图片

评论数最高的帖子是2016年的这个  。

图片

第一个帖子发布于2016年。

图片

下载东方财富的帖子和文章也是一样的,最后合并所有pdf生成一个pdf合集,大小550MB,效果见网盘  https://pan.quark.cn/s/70683e6c627a

点击左侧书签可跳转对应帖子 。

图片

http://www.dtcms.com/a/357991.html

相关文章:

  • 2025 批量下载雪球和东方财富帖子和文章导出excel和pdf
  • kind集群应用
  • 《云原生架构从崩溃失控到稳定自愈的实践方案》
  • 「鸿蒙系统的编程基础」——探索鸿蒙开发
  • 第12章:推荐算法与实践
  • 科技感网页计时器.html
  • 设计模式:抽象工厂模式(Abstract Factory Pattern)
  • 在word以及latex中引用zotero中的参考文献
  • 单例模式的mock类注入单元测试与友元类解决方案
  • 云存储(参考自腾讯云计算工程师认证)
  • Twitter舆情裂变链:指纹云手机跨账号协同机制提升互动率200%
  • 使用电脑操作Android11手机,连接步骤
  • 【序列晋升】21 Spring Cloud Gateway 云原生网关演进之路
  • DVWA靶场通关笔记-CSRF(Impossible级别)
  • 【90页PPT】新能源汽车数字化转型SAP解决方案(附下载方式)
  • 汽车加气站操作工证考试的复习重点是什么?
  • 【自然语言处理与大模型】多机多卡分布式微调训练的有哪些方式
  • C++ constexpr:编译时计算的高效秘籍
  • 复现论文块体不锈钢上的光栅耦合表面等离子体共振
  • 10.2 工程学中的矩阵
  • hadoop安欣医院挂号看诊管理系统(代码+数据库+LW)
  • 使用 Ansible 和 Azure Pipelines 增强您的 DevOps
  • Midjourney绘画创作入门操作创作(广告创意与设计)
  • 腾讯云centos7.6的运维笔记——从yum的安装与更新源开始
  • C++ 之 【map和set的模拟实现】(只涉及map和set的插入、迭代器以及map的operator[]函数)
  • Altium Designer中电路板设计
  • 流式HTTP MCP服务器开发
  • Android中handler机制
  • 《RANKGUESS: Password Guessing Using Adversarial Ranking》——论文解读
  • 主从DNS和Web服务器搭建过程