当前位置：首页 > news >正文

使用Selenium自动化获取抖音创作者平台视频数据

news 2025/11/4 23:35:17

前言

在当今短视频盛行的时代，抖音作为国内领先的短视频平台，吸引了大量内容创作者。对于创作者而言，了解自己发布的视频表现（如播放量、发布时间等）至关重要。本文将介绍如何使用Python的Selenium库来自动化获取抖音创作者平台上的视频数据。

技术栈

Python 3
Selenium
Chrome浏览器

实现步骤

1. 环境准备

首先需要安装必要的Python库：

bash

复制

下载

pip install selenium

同时需要下载对应版本的ChromeDriver，并将其放在系统PATH路径下或与脚本同一目录。

2. 代码解析

2.1 导入所需库

python

复制

下载

import os
import time
from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC

2.2 设置Chrome用户数据目录

python

复制

下载

account_en = "73118918368"
base_dir = os.getcwd()
new_user_data_directory = os.path.join(base_dir, f"{account_en}")
if not os.path.exists(new_user_data_directory):os.makedirs(new_user_data_directory)

这段代码创建了一个独立的Chrome用户数据目录，可以保存登录状态，避免每次运行都需要重新登录。

2.3 配置Chrome选项

python

复制

下载

options = webdriver.ChromeOptions()
options.add_argument(f"user-data-dir={new_user_data_directory}")  # 使用新的用户数据目录
options.add_argument("profile-directory=Default")
options.add_argument("--start-maximized")  # 最大化窗口
driver = webdriver.Chrome(options=options)

2.4 访问抖音创作者平台

python

复制

下载

driver.get("https://creator.douyin.com/creator-micro/content/manage")
time.sleep(1)

2.5 获取视频卡片信息

python

复制

下载

video_cards = WebDriverWait(driver, 10).until(EC.presence_of_all_elements_located((By.CSS_SELECTOR, ".video-card-info-aglKIQ"))

这里使用了显式等待（WebDriverWait）来确保元素加载完成，比单纯的time.sleep更加可靠。

2.6 解析视频数据

python

复制

下载

for card in video_cards:try:# 获取标题信息title = card.find_element(By.CSS_SELECTOR, ".info-title-text-YTLo9y").texttitle_part = title.split(' ')[0] if ' ' in title else title# 获取发布时间time_element = card.find_element(By.CSS_SELECTOR, ".info-time-iAYLF0")publish_time = time_element.text# 获取播放量play_count = card.find_element(By.XPATH,".//div[contains(@class, 'metric-item-u1CAYE') and .//div[text()='播放']]//div[contains(@class, 'metric-value-k4R5P_')]").textprint(f"标题: {title_part}")print(f"发布时间: {publish_time}")print(f"播放量: {play_count}")print("-" * 30)except Exception as e:print(f"处理卡片时出错: {e}")continue