当前位置: 首页 > wzjs >正文

国外域名购买网站seo软件全套

国外域名购买网站,seo软件全套,深圳建设局官网站,百度搜索引擎链接有如下一个网页,想要抓取其中内容,主要是IP Address和Port,使用python实现。 用F12看一下网页源代码,对应上图表格内容的部分如下: 使用python和lxml来定位爬取。 首先要安装lxml,如下命令(可以…

有如下一个网页,想要抓取其中内容,主要是IP Address和Port,使用python实现。

用F12看一下网页源代码,对应上图表格内容的部分如下:

 

使用python和lxml来定位爬取。

首先要安装lxml,如下命令(可以在pycharm项目的Terminal中运行):

pip3 install lxml

实现代码:

from lxml import etree
import requestsurl = 'https://www.example.com'
r = requests.get(url)
result = r.text
html = etree.HTML(result)rows = html.xpath(".//div[@class='table-responsive fpl-list']/table/tbody/tr[position()>0]")proxy_list = []
for row in rows:td_list1 = row.xpath('./td[1]')td_list2 = row.xpath('./td[2]')ip = td_list1[0].text.replace(' ','').replace('\t','').replace('\n','')port = td_list2[0].text.replace(' ','').replace('\t','').replace('\n','')web_proxy = {'ip': ip, 'port': port, 'types': 0, 'protocol': '0', 'country': '0', 'area': '0', 'speed': 100}proxy_list.append(web_proxy)print(proxy_list

说明:

在HTML中,tr、td、th是用于构建表格的核心标签‌:tr(Table Row)定义表格行,td(Table Data)定义标准数据单元格,th(Table Header)定义表头单元格。‌‌

结合上述代码,rows即是获取的表格中的所有行。

然后针对每一行进行操作。从每一行中,定位并获取需要的单元格的文本内容(此行第一列的单元格就是td[1],第二列就是td[2],使用.text获取其文本内容,注意:使用row.xpath获取出的是一个列表,需要加一个[0]来成为单个元素)。

http://www.dtcms.com/wzjs/250649.html

相关文章:

  • 动漫网站设计理念怎么在百度做网站推广
  • 关于建设网站的图片素材seo交流论坛seo顾问
  • 微信微网站建设平台临沂做网站推广的公司
  • 网站如何优化关键词网站排名优化推广
  • 营口pc网站开发南京百度竞价推广公司排名
  • 中国建设银行网站用户名网店推广实训系统
  • 简单网站建设课程培训心得体会范文大全1000字
  • 网站域名怎么做宁波seo软件
  • wordpress建站优化百度广告投放电话
  • b2b网站怎么做网站建设方案外包
  • 网站建设教程浩森宇特制作网站教学
  • 做一个flash网站多少钱网络广告人社区官网
  • 郯城做网站国内免费推广产品的网站
  • 网站做全景图预览中南建设集团有限公司
  • 网站建设发展历程爱站长尾词
  • 域名虚拟服务器做网站关键词优化推广排名软件
  • 沛县网络营销是什么免费seo刷排名
  • dede网站404怎么做怎么做推广和宣传
  • 帮别人做诈骗网站技术天津关键词优化专家
  • wordpress popupsem和seo有什么区别
  • 网站设计教程及在线模拟器百度答主招募入口官网
  • java网站开发工程师百度app下载安装 官方
  • 外贸企业招聘宁波seo网络优化公司
  • 网站流量平台深圳网页搜索排名提升
  • wordpress一键缓存天津seo霸屏
  • 杭州建设网站的公司郑州互联网公司排名
  • 昆明网站搭建公司做seo推广公司
  • 淘宝上做网站权重指数函数求导公式
  • 网站建设 asp 武汉昆明seo推广外包
  • 宠物网站设计说明书找相似图片 识别