当前位置: 首页 > news >正文

获取小红书某个用户列表

from playwright.sync_api import sync_playwright
import time


cookie=[]  #用自己的cookie

def capture_response(response, url_to_capture, api_response_data):
# 检查响应的 URL 是否匹配
if url_to_capture in response.url:
# 检查是否是 JSON 格式
if 'application/json' in response.headers.get('content-type', ''):
api_response_data.append(response.json())  # 将 JSON 数据添加到列表中
p = sync_playwright().start()
browser = p.chromium.launch(headless=True)
context = browser.new_context()
context.add_cookies(cookie)
page = context.new_page()

api_response_data = []
url_to_capture = 'https://edith.xiaohongshu.com/api/sns/web/v1/search/usersearch'
page.on('response', lambda response: capture_response(response, url_to_capture, api_response_data))

page.goto("https://www.xiaohongshu.com/search_result/?keyword=%25E5%25B0%258F%25E4%25B9%258C%25E8%258B%258F&source=web_explore_feed&type=51")
page.wait_for_load_state('load')
page.locator('//div[text()=" 用户"]').click()
page.wait_for_event('response')
#page.wait_for_timeout(3000)
while True:
page.mouse.wheel(0, 1000)
#page.wait_for_timeout(1000)
try:
page.wait_for_selector('//div[text()=" - THE END - "]',timeout=50)
print("下拉结束")
break
except Exception as e:
print("继续下拉")
pass
page.wait_for_load_state('load')
#print(page.content())
print(len(api_response_data))
#browser.close()

for k in api_response_data:
for i in k['data']['users']:
print(i['name'])
print(i['sub_title'])
print(i['image'])
print("====================================")

http://www.dtcms.com/a/355306.html

相关文章:

  • Swift 解法详解 LeetCode 365:水壶问题
  • day083-Filebeat数据采集案例与Kibana可视化应用
  • Leetcode 494. 目标和 动态规划-01背包
  • 【踩坑记录】SpringBoot 项目报 Communications link failure 的解决方法
  • 数据结构初阶:详解双链表
  • 在angular20中使用monaco-editor
  • LLM Agent工具设计规范总结
  • Python 实现归并排序:从原理到代码
  • Ansys Electronics Desktop 2025 R2 软件界面介绍
  • open webui源码分析10-四个特征之搜索
  • 系统架构师-软件工程
  • 前端响应式设计
  • 推荐系统王树森(五)重排多样性提升
  • 银河麒麟桌面操作系统:为什么不让root直接登录图形界面?以及如何安全地解决这个问题
  • 英伟达营收和利润均超出市场预期,但盘后一度跌超5%
  • Groovy语法入门
  • [光学原理与应用-321]:皮秒深紫外激光器产品不同阶段使用的工具软件、对应的输出文件
  • 客户案例 | 国际知名内衣品牌x甄知科技,领航IT服务新征程
  • linux 网络:并发服务器及IO多路复用
  • 开发避坑指南(42):Vue3 element ui el-table单选实现方案
  • HTML静态页面实现材积计算器和材积表生成器
  • 动手学深度学习(pytorch版):第七章节—现代卷积神经网络(5)批量规范化
  • 吴炳锡:AI 时代下的湖仓一体化平台建设的思考
  • 从枯燥C++到趣味音乐:我的Windows系统底层探索之旅
  • 公共字段自动填充
  • Foundry工具大全
  • uniapp vue3 canvas实现手写签名
  • 【Node.js从 0 到 1:入门实战与项目驱动】2.4 开发工具推荐(VS Code 、IDEA及插件、终端工具、调试工具)
  • Cesium入门教程(二)环境搭建(HTML版)
  • QT:【第一个QT程序】【信号和槽】