当前位置: 首页 > news >正文

python实战项目58:采集蜻蜓FM热门音频top排行榜

python实战项目58:采集蜻蜓FM热门音频top排行榜

  • 一、采集流程介绍
  • 二、数据接口采集
  • 三、使用xpath提取页面数据
    • 1、抓包,找到数据接口
    • 2、发送请求,获取数据
    • 3、提取数据
    • 4、保存数据

一、采集流程介绍

蜻蜓FM热门音频top排行榜的链接为: https://m.qingting.fm/rank/,首页如下图所示:
在这里插入图片描述
采集的思路为1、抓包、找到数据接口;2、发送请求;3、接收请求、提取数据;4、保存数据。

二、数据接口采集

蜻蜓FM热门音频top排行榜经改版之后目前为静态网站,但之前的数据接口依然可用,向接口发送请求可以直接获取json数据,完整代码如下:

import csv
import os
import requests

headers = {
   
    
http://www.dtcms.com/a/43499.html

相关文章:

  • DeepSeek后训练:监督微调和强化学习
  • WebGL 渲染器 WebGLRenderer
  • 从0-1学习Mysql第九章: 分区与分库分表
  • 【网络安全 | 漏洞挖掘】利用文件上传功能的 IDOR 和 XSS 劫持会话
  • React(12)案例前期准备
  • PyQT6是干啥的?
  • 2.数据结构:1.Tire 字符串统计
  • PDF文档中表格以及形状解析
  • Electron一小时快速上手
  • 【Swift 算法实战】城市天际线问题解法
  • 231.跳跃游戏
  • 蓝桥杯备考:DFS剪枝之数的划分
  • React 组件基础介绍
  • 新一代跨境电商ERP系统:从订单到发货的全流程自动化管理
  • Git GitHub基础
  • Web Worker 使用教程
  • 执行yum -y install npt 报错解决
  • linux ununtu通过nginx-1.6.2.tar.gz安装nginx并安装在自定义目录XXX下 的步骤
  • 示波器探头衰减值:简单来说就是“信号缩小器
  • docker启动elasticsearch,挂载文件报错:Device or resource busy
  • ssh配置 远程控制 远程协作 github本地配置
  • 蓝桥杯备赛-前缀和-可获得的最小取值
  • 信号处理:互相关函数
  • 蓝桥与力扣刷题(蓝桥 特别数的和)
  • 论文:KernelBench: Can LLMs Write Efficient GPU Kernels?
  • centos虚拟机无法安装工具
  • Android开发奇葩bug:布局宽高不自动自适应了
  • 月份天数总结
  • 【考试大纲】高级系统架构设计师考试大纲
  • 【Rabbitmq篇】高级特性----TTL,死信队列,延迟队列