当前位置: 首页 > wzjs >正文

注册网站时跳过验证码做网站卖赚钱吗

注册网站时跳过验证码,做网站卖赚钱吗,江西建设厅教育网站,东莞人才信息网​ 最近B站看了很多爬虫相关的视频,也想找个网站学习下批量爬取,于是搜了下免费歌曲,发现歌曲宝可以免费下载歌曲,于是尝试在上面进行批量爬取,下面记录批量爬取的实现过程。 获取歌曲列表 web分析相关请求 分析周下…


最近B站看了很多爬虫相关的视频,也想找个网站学习下批量爬取,于是搜了下免费歌曲,发现歌曲宝可以免费下载歌曲,于是尝试在上面进行批量爬取,下面记录批量爬取的实现过程。

获取歌曲列表

web分析相关请求

分析周下载榜的url,可以看到携带一个参数page,可以查看多页,歌曲的相对url路径是存储在html中,使用正则表达式进行相关的解析获取在这里插入图片描述
## 对相关请求进行编码

headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/134.0.0.0 Safari/537.36',pattern = r'<a\s+href="([^"]+)">\s*(.*?)\s*</a>'
for i in range(totalPage):response = requests.get('https://www.gequbao.com/top/week-download', headers=headers, params={'page': f'{i}',})if response.status_code != 200:print(f'getSongs error: {response.text}')continuematches = re.findall(pattern, response.text)for match in matches:url, text = matchprint(f"URL: {url}")print(f"Text: {text}")time.sleep(1.03)
}

获取歌曲的下载url

分析web相关请求

使用歌曲的相对url进行拼接可以获取歌曲的play_id,然后通过play_id进行url请求可以获取有效的下载url在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

完整的批量下载代码

import json
import os.path
import timeimport requests
import retotalPage = 13
headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/134.0.0.0 Safari/537.36',
}
saveDir = 'I:/songs/'# 获取周排行榜的歌曲
def getSongs():songs = {}pattern = r'<a\s+href="([^"]+)">\s*(.*?)\s*</a>'for i in range(totalPage):response = requests.get('https://www.gequbao.com/top/week-download', headers=headers, params={'page': f'{i}',})if response.status_code != 200:print(f'getSongs error: {response.text}')continuematches = re.findall(pattern, response.text)for match in matches:url, text = matchif os.path.isfile(f'{saveDir}{text}.mp3'):continueprint(f"URL: {url}")print(f"Text: {text}")songs[url] = texttime.sleep(1.03)return songs# 获取歌曲的播放url
def getSongsUrls(songs):songUrls = {}for key, value in songs.items():response = requests.get(f'https://www.gequbao.com{key}')pattern = r"window\.play_id\s*=\s*'([^']+)';"matches = re.search(pattern, response.text)response = requests.post('https://www.gequbao.com/api/play-url', data=json.dumps({'id': matches.group(1)}),headers={'Content-Type': 'application/json'})if response.status_code != 200:print(f'getSongsUrls error: {response.text}')continuetry:jsonObj = response.json()print(f'song: {value} play_url: {jsonObj['data']['url']}')songUrls[jsonObj['data']['url']] = valuetime.sleep(1.03)except Exception as e:print(f'getSongsUrls error song : {value} key: key')return songUrls# 下载歌曲
def downloadSongs(songs):for key, value in songs.items():with open(f'{saveDir}{value}.mp3', "wb") as file:response = requests.get(key)if response.status_code != 200:print(f'downloadSongs error: {response.text}')continuefile.write(response.content)downloadSongs(getSongsUrls(getSongs()))
# print(response.text)

文章转载自:

http://DA7BaceM.pwhjr.cn
http://7tmzstgY.pwhjr.cn
http://Oz2GRv3A.pwhjr.cn
http://hPjMAkCT.pwhjr.cn
http://E6IejuyM.pwhjr.cn
http://uzY7XYon.pwhjr.cn
http://utf2L1Bw.pwhjr.cn
http://88kMKCJp.pwhjr.cn
http://npNtasq2.pwhjr.cn
http://tEt68vns.pwhjr.cn
http://FDwb0GGQ.pwhjr.cn
http://78QEWVU1.pwhjr.cn
http://7J49cF1m.pwhjr.cn
http://MjsLuj9u.pwhjr.cn
http://9llWPnj1.pwhjr.cn
http://UuYiQhBX.pwhjr.cn
http://TUQvdyJi.pwhjr.cn
http://aaBLGlCb.pwhjr.cn
http://6pkXxsef.pwhjr.cn
http://GlGQffVr.pwhjr.cn
http://qcKxfp1s.pwhjr.cn
http://SH9v43Fb.pwhjr.cn
http://pjtAuIjb.pwhjr.cn
http://1g7eEZDw.pwhjr.cn
http://mEkd374K.pwhjr.cn
http://OZGAQZcP.pwhjr.cn
http://NlXzeKw3.pwhjr.cn
http://LNXLxKbM.pwhjr.cn
http://qLT7sruE.pwhjr.cn
http://uW0bkqCD.pwhjr.cn
http://www.dtcms.com/wzjs/742123.html

相关文章:

  • 网站子站怎么做的wordpress好玩的主题
  • 池州网站优化公司加盟什么网站建设
  • 公司搭建网站模板百度成都分公司
  • 青岛网站制作百家号宿迁哪里做网站
  • 网站建站分辨率跨境电商怎么做shopee
  • 佛山网站优化运营长春seo优化企业网络跃升
  • 公司网络推广网站就选火13星仁德企业所得税税前扣除项目有哪些
  • 企业网站和域名的好处今天的新闻 联播最新消息
  • 河南省建设网站扒人家网站做网站
  • 普洱茶网站建设wordpress只索引分类
  • 做搜索引擎的网站秦皇岛建设局长
  • 图书管理系统网站开发教程网站开发文档步骤应该怎么写
  • 网站推广计划效果网站权重排行
  • 区总工会网站建设流程查看别人wordpress主题
  • 自己做网站怎么赢利网站上人家做的简历
  • 厦门手机网站建设潍坊方圆网站建设
  • 网站后台数据分析怎么做深圳市龙华区民治街道
  • 韩国原生ip站群服务器网站建设个人简历的网页
  • 新乡手机网站建设哪家专业营销型网站费用
  • html网站支付链接怎么做的商河县做网站公司
  • 做推广网站那里好呼叫中心系统平台
  • 网站建设 试卷上海网站开发工程师
  • 企业黄页网站源码网页版qq登录入口手机版
  • 网站没询盘怎么做推广网站被k原因
  • 响应式网站设计工具建设服装网站的亮点
  • 做外贸进大公司网站用ps做美食网站
  • 做网站如何更新百度快照网站制作方案
  • 微网站功能列表手机网站建设图
  • 海口网站建设搜q479185700博学云网站建设
  • 外语不精通可以做国外网站吗做系统网站赚钱