当前位置: 首页 > wzjs >正文

设计网站大全有哪些网站放到云服务器上怎么做

设计网站大全有哪些,网站放到云服务器上怎么做,网页空间,wordpress用mysql5.6上一篇文章中带大家学习了 lxml 模块以及 XPath 语法,本文针对某网新房数据编写爬虫进行实战。 一、网页信息的获取 抓取地址:https://cd.fang.lianjia.com/loupan/ import requestsLink https://cd.fang.lianjia.com/loupan/ Headers {User-Agent: …

上一篇文章中带大家学习了 lxml 模块以及 XPath 语法,本文针对某网新房数据编写爬虫进行实战。

一、网页信息的获取

抓取地址:https://cd.fang.lianjia.com/loupan/

import requestsLink = 'https://cd.fang.lianjia.com/loupan/'
Headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/134.0.0.0 Safari/537.36'
}
response = requests.get(url=Link, headers=Headers)
if response.status_code == 200:html_source = response.textprint(html_source)
else:print(f'状态码:{response.status_code}, 请检查')

二、新房数据的抓取

(1)当前页面所有在售新房获取

root = etree.HTML(html_source)
# 找到所有房屋信息对应的 li 标签,构建 li 列表
li_list = root.xpath('/html/body/div[3]/ul[@class="resblock-list-wrapper"]/li')

(2)部分房屋信息抓取

for li in li_list:# 经过分析,房屋名称信息较好获取,而要获得房屋面积单价则需要借助分支语法house_name = li.xpath('./div/div[1]/h2/a/text()')  # 房屋名称house_unit_price = li.xpath('./div/div[6]/div[1]/span[1]/text()|./div/div[6]/div[1]/span[2]/text()')  # 房屋面积单价print(house_name[0], ''.join(house_unit_price))

三、完整代码

爬虫代码的编写,除了要有扎实的基础知识外,还要善于分析网页内容。
import requests
from lxml import etreeLink = 'https://cd.fang.lianjia.com/loupan/'
Headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/134.0.0.0 Safari/537.36'
}
response = requests.get(url=Link, headers=Headers)
if response.status_code == 200:html_source = response.textroot = etree.HTML(html_source)# 找到所有房屋信息对应的 li 标签,构建 li 列表li_list = root.xpath('/html/body/div[3]/ul[@class="resblock-list-wrapper"]/li')for li in li_list:# 经过分析,房屋名称信息较好获取,而要获得房屋面积单价则需要借助分支语法house_name = li.xpath('./div/div[1]/h2/a/text()')  # 房屋名称house_unit_price = li.xpath('./div/div[6]/div[1]/span[1]/text()|./div/div[6]/div[1]/span[2]/text()')  # 房屋面积单价house_price = li.xpath('./div/div[6]/div[@class="second"]/text()')  # 价格区间house_address = li.xpath('./div/div[2]/span[1]/text()|./div/div[2]/span[2]/text()|./div/div[2]/a/text()')  # 地理位置print(house_name[0], ''.join(house_unit_price), house_price[0], '/'.join(house_address))
else:print(f'状态码:{response.status_code}, 请检查')
http://www.dtcms.com/wzjs/599222.html

相关文章:

  • 项目负责人质量建设厅官方网站中国白云手机网站建设
  • 网站怎样做seo推广wordpress千万数据
  • 百度多长时间收录网站城建局官网
  • 域名和空间网站怎么自己做网站排名
  • 网站运营专员做什么WordPress国外赚钱
  • 最牛的html5网站建设上海文化传媒公司排名
  • wordpress电影下载站主题苏州互联网公司工资
  • 扶贫工作网站建设方案深圳企业网站制作公司查询
  • 企业网站维护兼职阿里企业邮箱免费申请入口
  • 郑州网站托管公司哪家好离婚协议书正规模板
  • 网站建设规划方案包括推广赚佣金的软件排名
  • 网站核心推广思路从哪里可以建公司网站
  • 装饰网站建设软件下载网站 刷流量 SEO
  • dede网站如何换源码网站建设规划方案包括
  • 如何自己创办一个网站iis wordpress 500
  • 企业网站建设选择兴田德润园林景观设计公司点评的网站和论坛
  • 庆阳定制网站长椿街网站建设
  • 首页%3e新闻%3e正文 网站怎么做璧山职教中心示范校建设网站
  • 创新的品牌网站建设我的免费网
  • 域名不作网站用途如何申请一个网站域名
  • 微信网站的建立高校网络架构
  • 网络推广网站的方法网站建站图片
  • 网站开发属于什么科目网站开发 职业环境分析
  • 网站文字配色asp 网站开发
  • 国际网站怎么开通深圳住房和建设局网站公开招标
  • 北京 外贸型网站建设做ppt哪个网站好
  • 我的电脑做网站服务器吗厦门网页设计培训
  • 做机械比较好的外贸网站网站版面在线设计
  • 黄冈网站官方登录平台什么做网站赚钱
  • 昆明网站优化公司辣妹子影院电视剧免费播放