当前位置: 首页 > news >正文

【苹果cms 2】资源站动漫采集爬取

之前网站搭建好后还没有数据,通过各采集站教程可以导入数据,但是不能自定义,这里写下如何快速采集特定类型的资源,比如说动漫视频

量子资源

https://lzizy.net/
根据教程找到接口地址
https://cj.lziapi.com/api.php/provide/vod/?ac=list
请求结果样式如下

{
    "code": 1,
    "msg": "数据列表",
    "page": 1,
    "pagecount": 5097,
    "limit": "20",
    "total": 101932,
    "list": [
        {
            "vod_id": 103400,
            "vod_name": "一息尚存",
            "type_id": 11,
            "type_name": "剧情片",
            "vod_en": "zuihoudehuxi",
            "vod_time": "2025-04-06 04:08:49",
            "vod_remarks": "HD",
            "vod_play_from": "liangzi,lzm3u8"
        },
	]
	"class": [
        {
            "type_id": 30,
            "type_pid": 4,
            "type_name": "日韩动漫"
        },
	]
}

比如只想要 日韩动漫的数据,需要筛选 type_id

maccms 对外接口 Provide

发现其接口也是 maccms 原生提供的,查看源码分析参数
application\api\controller\Provide.php

if (!empty($this->_param['t'])) {
	if (empty($GLOBALS['config']['api']['vod']['typefilter']) || strpos($GLOBALS['config']['api']['vod']['typefilter'], $this->_param['t']) !== false) {
		$where['type_id'] = $this->_param['t'];
	}
}

if (empty($this->_param['pg'])) {
	$this->_param['pg'] = 1;
}
$pagesize = $GLOBALS['config']['api']['vod']['pagesize'];
if (!empty($this->_param['pagesize']) && $this->_param['pagesize'] > 0) {
	$pagesize = min((int)$this->_param['pagesize'], 100);
}

$res = model('vod')->listData($where, $order, $this->_param['pg'], $pagesize, 0, $field, 0);

可见通过 t 对应 type_id, pg 对应页数

采集爬取

构建请求
https://cj.lziapi.com/api.php/provide/vod/?ac=detail&t=30&pg=1
返回样式

{
    "code": 1,
    "msg": "数据列表",
    "page": 1,
    "pagecount": 189,
    "limit": "20",
    "total": 3761,
    "list": []
}

遍历 pagecount 可获取全部数据。

数据入库

将 list 中数据这里通过 python 批量导入 mysql 数据库后,之前网站便有数据了,把这个资源站所有的日韩动漫全部爬取了总共 79 页数据,共计 6x8x78+3x6-1 = 3761 条,对应接口给出的 total

相关文章:

  • C#容器源码分析 --- List<T>
  • AI技术实战:从零搭建图像分类系统全流程详解
  • SaaS、Paas、IaaS、MaaS、BaaS五大云计算服务模式
  • 【前端网络请求】XHR封装,支持文件上传、进度监控、混合字段传输
  • 基于SpringBoot的瑜伽馆管理系统【附源码】
  • Java 基础数据类型与运算符深度剖析
  • Python、C++中的查找
  • Spring Bean的创建过程与三级缓存的关系详解
  • socket到底是什么
  • 分发饼干问题——用贪心算法解决
  • Oracle 11G RAC 删除添加节点(一):删除节点
  • 智能SEO关键词AI精准布局
  • swagger 注释说明
  • LeetCode 34 在排序数组中查找元素的第一个和最后一个位置
  • 【5G学习】5G中常说的上下文之上下文响应
  • 在线地图支持天地图和腾讯地图,仪表板和数据大屏支持发布功能,DataEase开源BI工具v2.10.7 LTS版本发布
  • java中的Future的设计模式 手写一个简易的Future
  • C语言 ——— 认识C语言
  • 应对海量数据归档难题?AWS Glacier 的低成本冷存储解决方案实践指南
  • Keras使用1
  • 陕西省通报6起违反八项规定典型问题,省卫健委原主任刘宝琴违规收受礼品礼金
  • 五一小长假,带着小狗去上海音乐厅
  • 铁路五一假期运输今日启动,预计发送旅客1.44亿人次
  • 牛市早报|国家发改委:将推出做好稳就业稳经济推动高质量发展若干举措
  • 走访中广核风电基地:701台风机如何乘风化电,点亮3000万人绿色生活
  • 上海灵活就业人员公积金新政有哪些“创新点”?