当前位置：首页 > news >正文

利用Python爬虫获取Shopee（虾皮）商品详情：实战指南

news 2025/10/14 5:14:03

在跨境电商领域，Shopee（虾皮）作为东南亚及台湾地区领先的电商平台，拥有海量的商品信息。无论是进行市场调研、数据分析，还是寻找热门商品，获取Shopee商品详情都是一项极具价值的任务。然而，手动浏览和整理这些信息显然是低效且容易出错的。幸运的是，通过编写Python爬虫程序，我们可以高效地完成这一任务。本文将详细介绍如何利用Python爬虫获取Shopee商品详情，并提供完整的代码示例。

一、为什么选择Python爬虫？

Python因其简洁的语法和强大的库支持，成为爬虫开发的首选语言之一。以下是Python爬虫的几个优势：

丰富的库支持
Python拥有强大的第三方库，如requests用于发送网络请求，BeautifulSoup用于解析HTML页面，pandas用于数据处理和存储。
易学易用
Python语法简洁，易于上手，适合初学者快速入门。
强大的社区支持
Python拥有庞大的开发者社区，遇到问题时可以轻松找到解决方案。

二、准备工作

在开始编写爬虫之前，我们需要做好以下准备工作：

Python环境
确保你的电脑上安装了Python（推荐使用Python 3.8及以上版本）。
安装必要的库
我们需要以下Python库：
- requests：用于发送HTTP请求。
- BeautifulSoup：用于解析HTML页面。
- pandas：用于将数据存储为表格格式，方便后续分析。
安装这些库非常简单，只需要运行以下命令即可：

bash
```
pip install requests beautifulsoup4 pandas
```

三、代码实现

1. 获取商品详情

Shopee提供了API接口用于获取商品详情。通过商品ID和店铺ID，我们可以发送请求并获取商品的详细信息。

示例代码：

Python

import requests
import pandas as pd

def fetch_shopee_product_details(product_id, shop_id):
    # Shopee商品详情API
    url = f"https://shopee.tw/api/v2/item/get?itemid={product_id}&shopid={shop_id}"
    headers = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36",
        "Accept": "application/json"
    }
    
    response = requests.get(url, headers=headers)
    if response.status_code == 200:
        return response.json()
    else:
        print(f"请求失败，状态码：{response.status_code}")
        return None

def save_product_details(data, file_path):
    # 提取关键信息
    item = data.get("item", {})
    product_details = {
        "商品名称": item.get("name"),
        "价格": item.get("price") / 100000,  # Shopee价格单位为分
        "库存": item.get("stock"),
        "销量": item.get("sold"),
        "商品链接": f"https://shopee.tw/{item.get('name')}-i.{item.get('shopid')}.{item.get('itemid')}"
    }
    
    # 保存为CSV文件
    df = pd.DataFrame([product_details])
    df.to_csv(file_path, index=False, encoding="utf-8-sig")
    print(f"商品详情已保存到 {file_path}")

if __name__ == "__main__":
    # 示例：商品ID和店铺ID
    product_id = "123456789"  # 替换为实际商品ID
    shop_id = "987654321"     # 替换为实际店铺ID
    output_file = "shopee_product_details.csv"
    
    product_data = fetch_shopee_product_details(product_id, shop_id)
    if product_data:
        save_product_details(product_data, output_file)