当前位置: 首页 > wzjs >正文

现代电子商务网站建设技术文化旅游做的好的网站

现代电子商务网站建设技术,文化旅游做的好的网站,苏州专业网站建设开发公司,网站建设与网站优化案例一:使用DrissionPage抓取BOSS上的招聘信息 使用requests获取BOSS网站上的内容是非常困难的,但是通过网页自动化工具DrissionPage或者是Playwright或者是Seleenium是非常容易的,接下来我们就给出使用DrissionPage爬取BOSS网站python招聘的…

案例一:使用DrissionPage抓取BOSS上的招聘信息

使用requests获取BOSS网站上的内容是非常困难的,但是通过网页自动化工具DrissionPage或者是Playwright或者是Seleenium是非常容易的,接下来我们就给出使用DrissionPage爬取BOSS网站python招聘的信息,仅供学习参考。

import time
from DrissionPage import Chromium
import pandas as pdpage = Chromium().latest_tab # 打开一个标签页,并让该标签页访问BOSS直聘
page.listen.start('https://www.zhipin.com/wapi/zpgeek/search/joblist.json') # 监听对应的能够返回数据的Ajax请求(监听可以放在访问页面之前也可以放在访问页面之后)
page.get('https://www.zhipin.com/yantai/?ka=header-home') # 访问BOSS直聘page.ele('xpath=//p[@class="ipt-wrap"]/input').input('python')
page.ele('xpath=//button[@class="btn btn-search"]').click()res = page.listen.wait() # 获取监听到的Ajax请求的响应
print('res:::',res.response.body)
joblist = res.response.body['zpData']['jobList']for i in range(10):next_btn = page.ele("xpath=//div[@class='options-pages']/a/i[@class='ui-icon-arrow-right']")next_btn_a = next_btn.parent().attr('class') # 取出next_btn标签父标签的class属性if 'disabled' not in next_btn_a:next_btn.click()time.sleep(2)print('爬虫中---')res = page.listen.wait()joblist += res.response.body['zpData']['jobList']else:print('爬虫结束')# 数据保存
df = pd.DataFrame(joblist)
df.to_excel('boss直聘.xlsx', index=False)page.close()

 在上述的程序中,我们使用DrissionPage种自带的监听技术获取Ajax相应数据。分析BOSS网站返回的数据,发现他是Ajax请求,当让页不可以使用监听技术,直接等待页面加载完毕之后定位元素所在的位置即可。

程序运行过程中可能会出现卡在某一个页面不动了,需要我们手动点击下一页(人工接管一下再程序接管)才可以正常运行。

案例二:使用DrissionPage破解瑞数

使用requests破解瑞数是非常困难的,我们接下来仍然使用DrissionPage获取相应的数据,本代码仅供大家参考学习。

from DrissionPage import Chromium,ChromiumOptions
import time,random# 定义一个方法用于获取某个网页的内容
def get_url_content(page): # 传入的对象是一个页面对象li_s = page.eles('xpath=//div[@class="pd0-20"]/ul/li')for li in li_s:title = li.ele('xpath=./a[@class="dy_title"]').text  # 取出标题content = li.ele('xpath=.//p[@class="neirong"]').text  # 取出内容print(title)print(content)print('==========================================')options = ChromiumOptions()
options.auto_port()browser = Chromium(options)
page = browser.latest_tabpage.get(url='https://sugh.szu.edu.cn/Html/News/Columns/7/Index.html',retry=3,timeout=15,interval=3)
get_url_content(page) # 获取第一页的page内容next_btn = page.ele('xpath=//a[@class="pagination_nextpage ui-state-default ui-corner-all"]')# 翻页爬取
while next_btn.attr('href'):next_btn.click()time.sleep(random.randint(3, 5))  # 设置一个等待网页加载的时间print('正在爬取下一页-----------------------------------------------------------------------------------')get_url_content(page)  # 获取下一页的page内容next_btn = page.ele('xpath=//a[@class="pagination_nextpage ui-state-default ui-corner-all"]')
print('爬虫结束')page.close()'''
pagination_nextpage ui-state-default ui-corner-all
pagination_lastpage ui-state-default ui-corner-all
'''


文章转载自:

http://xQqo046c.yhjrc.cn
http://Xx3oYLw0.yhjrc.cn
http://Te2yFjVN.yhjrc.cn
http://PxNmUB4m.yhjrc.cn
http://cuBTnKqx.yhjrc.cn
http://IgFKUEiR.yhjrc.cn
http://b10lyWLF.yhjrc.cn
http://VQ4CfUzX.yhjrc.cn
http://A1BSm3cv.yhjrc.cn
http://yT2uYlFH.yhjrc.cn
http://nBnsaJYc.yhjrc.cn
http://ClihiBuZ.yhjrc.cn
http://vVR3P9so.yhjrc.cn
http://AGBAQrHl.yhjrc.cn
http://9Mu5mjDC.yhjrc.cn
http://FHIXWIPD.yhjrc.cn
http://agQry3ga.yhjrc.cn
http://suavGlD1.yhjrc.cn
http://J7riNyXL.yhjrc.cn
http://JzRSw9iz.yhjrc.cn
http://9aLHR7j4.yhjrc.cn
http://scwIuq4K.yhjrc.cn
http://PTXjs18L.yhjrc.cn
http://jrYtwTPS.yhjrc.cn
http://PHI7SQT1.yhjrc.cn
http://UROW2PP5.yhjrc.cn
http://h1SrBkfS.yhjrc.cn
http://pbDkgeM9.yhjrc.cn
http://RYz2EnOu.yhjrc.cn
http://f3Ctfs7D.yhjrc.cn
http://www.dtcms.com/wzjs/625119.html

相关文章:

  • 阿里云建设网站教程自建网站推广
  • 整站优化多少钱新品发布会现场
  • 下列关于wap手机网站建网站的专业公司
  • 在什么网站做推广最好印刷网站开发策划书
  • 网站做app的软件有哪些用于网站开发的语言
  • 移动端网站制作模板网站说说模板.
  • wordpress网站生成app应用工程信息网站谁做
  • 影院网站怎么做定制产品
  • 网站和网络建设调研情况数据库网站开发教程
  • 启航做网站好吗wordpress贴吧主题
  • 提供网站建设运营公司资质房天下官网首页
  • 做外贸必须建网站吗百度快照怎么使用
  • 菲律宾做网站wordpress获取文章中的图片
  • 都江堰网站建设公司问答营销是基于什么的新型网络营销方式
  • 如何做一个网站的功能吗做图模板网站有哪些内容
  • 杭州企业网站制作怎样开公众号
  • 网站开发mvc架构昆山网站建设哪家便宜
  • 营销推广运营 网站有哪些做动图的网站
  • 卖衣服的网站排名房地产公司网站源码
  • 网站快速排名技巧产品网络推广方案范文
  • 自己做网站挣钱吗国内做的比较好的网站是什么
  • 公司网站建设意见和建议haai商城网站建设公司排名
  • 网站建设:博采网络网站建设验收合同模板
  • 好玩的网站源码企业建设网站注意事项
  • 从网络安全角度考量_写出建设一个大型电影网站规划方案互联网营销是什么
  • 注册完域名怎么做网站广西壮族自治区司法厅官网
  • 产品型网站天水网站制作
  • 提升网站建设品质价位定制家具品牌
  • 一个网站2级域名多怎么给网站做关键词
  • 注册公司取名字大全南昌seo顾问