当前位置: 首页 > wzjs >正文

网站ftp查询公众号开发教程视频

网站ftp查询,公众号开发教程视频,电影网页制作素材,上海 网站设计 公司有如下一个网页,想要抓取其中内容,主要是IP Address和Port,使用python实现。 用F12看一下网页源代码,对应上图表格内容的部分如下: 使用python和lxml来定位爬取。 首先要安装lxml,如下命令(可以…

有如下一个网页,想要抓取其中内容,主要是IP Address和Port,使用python实现。

用F12看一下网页源代码,对应上图表格内容的部分如下:

 

使用python和lxml来定位爬取。

首先要安装lxml,如下命令(可以在pycharm项目的Terminal中运行):

pip3 install lxml

实现代码:

from lxml import etree
import requestsurl = 'https://www.example.com'
r = requests.get(url)
result = r.text
html = etree.HTML(result)rows = html.xpath(".//div[@class='table-responsive fpl-list']/table/tbody/tr[position()>0]")proxy_list = []
for row in rows:td_list1 = row.xpath('./td[1]')td_list2 = row.xpath('./td[2]')ip = td_list1[0].text.replace(' ','').replace('\t','').replace('\n','')port = td_list2[0].text.replace(' ','').replace('\t','').replace('\n','')web_proxy = {'ip': ip, 'port': port, 'types': 0, 'protocol': '0', 'country': '0', 'area': '0', 'speed': 100}proxy_list.append(web_proxy)print(proxy_list

说明:

在HTML中,tr、td、th是用于构建表格的核心标签‌:tr(Table Row)定义表格行,td(Table Data)定义标准数据单元格,th(Table Header)定义表头单元格。‌‌

结合上述代码,rows即是获取的表格中的所有行。

然后针对每一行进行操作。从每一行中,定位并获取需要的单元格的文本内容(此行第一列的单元格就是td[1],第二列就是td[2],使用.text获取其文本内容,注意:使用row.xpath获取出的是一个列表,需要加一个[0]来成为单个元素)。

http://www.dtcms.com/wzjs/533815.html

相关文章:

  • 南山做网站网站建设郑州公司
  • 电商网站改版思路wordpress设置版权
  • linux 如何做网站丰台网站开发联系电话
  • 网站搭建什么意思岳阳博物馆网站
  • 网站需求分析的主要内容无锡模板建站源码
  • 做宽带销售网站从哪个网站找钢做的微商
  • app使用什么做的网站精通网站建设 pdf微盘
  • 站长统计入口广东省建设局网站
  • 网站开发技术人员保密协议发布网站后备案
  • 成都价格网站建设服务公司wordpress灯箱代码
  • 短链接生成接口免费seo刷排名
  • 如何做企业网站内容策划如何看到网站的建设时间
  • 怎么给自己的网站做seo深圳南山建设局官方网站
  • wordpress 登录跳转谷歌seo搜索优化
  • 绍兴网站建设做网站坪地网站建设信息
  • 坂田网站建设推广公司网站建设 dw
  • 网站建设高清图兰州 网站建设公司
  • 淘宝客建设网站什么网站合适做流量
  • 微信公众号做的网站如何登陆工商局网站做变更
  • 做一个高端网站多少钱免费网站如何做宣传
  • 网站架构的建设企业管理软件排行榜前十
  • 自己做文学网站赚钱吗wordpress悬浮音乐插件
  • 网站改版意义wordpress浮动关注我们
  • wordpress站点制作wordpress仿站价格
  • 社保扣款怎么在社保网站上做》百度推广怎么收费
  • 东莞万江网站制作好网站建设公司有多少
  • 成都装饰公司网站建设杭州网络公司做网站报价
  • 教育公司网站模板安徽合肥建设局网站
  • 永久免费制作网站福田蒙派克6座上蓝牌京牌
  • 做企业平台网站成本wordpress注册页面模板怎么修改