当前位置: 首页 > news >正文

抖音 pc + 翻页

代码实现步骤:

request模块

1.发送请求模拟浏览器对于url地址发送请求

2.获取数据:获取服务器返回响应数据

3.解析数据:提取我们需要的数据内容

4.保存数据:把提取出来的数据保存到本地文件中

drissionpage模块

自动化模块:模拟人的行为对于浏览器进行操作

1.打开浏览器,访问网站

2.获取数据

3.解析数据

4.保存数据

drissionpage官方文档:DrissionPage官网https://www.drissionpage.cn/运行代码如下:

from DrissionPage import ChromiumPage
import requestsheaders = {'referer':'https://www.douyin.com/','user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/137.0.0.0 Safari/537.36'}
dp = ChromiumPage()dp.listen.start('web/aweme/post/')  # 监听
# 访问网站
dp.get('https://www.douyin.com/user/MS4wLjABAAAAx7--dRYA0mPwhwvxNJ-35i6sB8d1Kv4Sj1WmugquqiHK19QYlB18Ikx6cECT1RVO?from_tab_name=main')for page in range(1, 11):r = dp.listen.wait()  print(f'正在采集第{page}页')json_data = r.response.bodyinfo_list = json_data['aweme_list']for index in info_list:try:# 标题title = index['desc']# 视频链接video_url = index['video']['play_addr']['url_list'][0]# 视频idvideo_id = index['aweme_id']video_content = requests.get(url=video_url, headers=headers).contentwith open(f'video\\{title}---{video_id}.mp4', 'wb') as f:f.write(video_content)print(title, video_url, video_id)except:passdp.scroll.to_see('css:.ayFW3zux')

相关文章:

  • 《高等数学》(同济大学·第7版)第五章第一节定积分的概念与性质
  • 动态代理选择:JDK vs CGLIB
  • 荒原之梦:致力于考研数学实战
  • 如何卸载360及360壁纸
  • 【unitrix】 1.6 数值类型基本结构体(types.rs)
  • Java大模型开发入门 (8/15):连接外部世界(上) - RAG入门与文档加载
  • Ubuntu安装Gym及其仿真
  • 永磁同步电机控制算法--双矢量模型预测转矩控制MPTC(占空比)
  • Keepalived 高可用
  • MACD指标
  • java中扩展运算符
  • <11>-MySQL事务管理
  • 算法训练第十七天
  • Hugging face 和 魔搭
  • 浅拷贝 与 深拷贝
  • LeetCode - 35. 搜索插入位置
  • 戴维南端接与 RC端接
  • static的三种作用
  • 重读《人件》Peopleware -(16)Ⅲ 适当人选 Ⅰ霍恩布洛尔因素(上)
  • callback的原理和机制
  • 如何查询网站开发语言/电商网站建设开发
  • 用家里的电脑做网站服务器/软文客
  • 网站开发w亿玛酷1流量订制/国外外链平台
  • 国外服务器做视频网站/深圳百度推广竞价托管
  • 网站流水怎么做/怎么买域名自己做网站
  • 广州建设网站下载/cilimao磁力猫在线搜索