当前位置: 首页 > news >正文

【Python爬虫】使用python脚本拉取汽车网站品牌数据

示例代码说明:

在汽车之家网站拉取当月排行榜中汽车品牌、销量和价格信息,存为csv文档输出,使用正则表达式获取网页内容

import re
import pandas as pd
import requests

# 汽车之家车型列表页URL
url = 'https://cars.app.autohome.com.cn/carext/recrank/all/getrecranklistpageresult2?from=28&pm=2&pluginversion=11.65.0&model=1&channel=0&pageindex=1&pagesize=650&typeid=1&subranktypeid=1&levelid=0&price=0-9000&date=2025-02'
# 读取内容
urltext = requests.get(url).text
#汽车品牌
seriesnamedata = re.findall('"seriesname":"(.*?)"', urltext)
#汽车销量
righttextonedata = re.findall('"righttextone":"(.*?)"', urltext)
#去除销量列表中的空字符串
righttextonedataupdate=list(filter(None, righttextonedata))
#汽车价格
priceinfodata = re.findall('"priceinfo":"(.*?)"', urltext)
print('************************************---------------------------------***********************************')
# 转换为DataFrame并保存
if seriesnamedata:    
    df1 = pd.DataFrame({"品牌": seriesnamedata})
    df2 = pd.DataFrame({"销量": righttextonedataupdate})
    df3 = pd.DataFrame({"价格": priceinfodata})
    combined_df = pd.concat([df1, df2, df3], axis=1)
    combined_df.to_csv("autohome_brands.csv", index=False, encoding="utf_8_sig")
    print(f"成功提取 {len(combined_df)} 个品牌")
else:
    print("未找到品牌数据")

结果示例:

相关文章:

  • 1.NextJS基础
  • skynet网络包库(lua-netpack.c)的作用解析
  • 关于大数据的基础知识(四)——大数据的意义与趋势
  • AQS是什么,使用应注意什么
  • 【CXX-Qt】4.5 Traits
  • 【AndroidRTC-11】如何理解webrtc的Source、TrackSink
  • QML指示控件:ScrollBar与ScrollIndicator
  • 【江协科技STM32】Unix时间戳(学习笔记)
  • java 设置操作系统编码、jvm平台编码和日志文件编码都为UTF-8的操作方式
  • AI Agent开发大全第八课-Stable Diffusion 3的本地安装全步骤
  • FreeRTOS学习(九):中断管理
  • Android Compose框架的值动画(animateTo、animateDpAsState)(二十二)
  • 【MySQL】~/.my.cnf文件
  • 深入探讨MySQL数据库备份与恢复:策略与实践
  • EasyUI数据表格中嵌入下拉框
  • 【c++】【STL】unordered_set 底层实现总结
  • Spring Boot整合SSE实现消息推送:跨域问题解决与前后端联调实战
  • Siri接入DeepSeek快捷指令
  • matlab 模拟 闪烁体探测器全能峰
  • 计算机复试面试
  • AI把野史当信史?警惕公共认知的滑坡
  • 看纪录片抵学分,贺桂梅:纪录片是对抗低质碎片信息的好媒介
  • 证监会:坚决拥护党中央对王建军进行纪律审查和监察调查决定
  • 中国科学院院士张泽民已任重庆医科大学校长
  • 国台办:“台独”是绝路,外人靠不住
  • 海尔智家一季度营收791亿元:净利润增长15%,海外市场收入增超12%