当前位置: 首页 > wzjs >正文

企业建网站流程北京软件培训机构前十名

企业建网站流程,北京软件培训机构前十名,网站建设费按几年摊销,公司网站建设维护管理办法有如下一个网页,想要抓取其中内容,主要是IP Address和Port,使用python实现。 用F12看一下网页源代码,对应上图表格内容的部分如下: 使用python和lxml来定位爬取。 首先要安装lxml,如下命令(可以…

有如下一个网页,想要抓取其中内容,主要是IP Address和Port,使用python实现。

用F12看一下网页源代码,对应上图表格内容的部分如下:

 

使用python和lxml来定位爬取。

首先要安装lxml,如下命令(可以在pycharm项目的Terminal中运行):

pip3 install lxml

实现代码:

from lxml import etree
import requestsurl = 'https://www.example.com'
r = requests.get(url)
result = r.text
html = etree.HTML(result)rows = html.xpath(".//div[@class='table-responsive fpl-list']/table/tbody/tr[position()>0]")proxy_list = []
for row in rows:td_list1 = row.xpath('./td[1]')td_list2 = row.xpath('./td[2]')ip = td_list1[0].text.replace(' ','').replace('\t','').replace('\n','')port = td_list2[0].text.replace(' ','').replace('\t','').replace('\n','')web_proxy = {'ip': ip, 'port': port, 'types': 0, 'protocol': '0', 'country': '0', 'area': '0', 'speed': 100}proxy_list.append(web_proxy)print(proxy_list

说明:

在HTML中,tr、td、th是用于构建表格的核心标签‌:tr(Table Row)定义表格行,td(Table Data)定义标准数据单元格,th(Table Header)定义表头单元格。‌‌

结合上述代码,rows即是获取的表格中的所有行。

然后针对每一行进行操作。从每一行中,定位并获取需要的单元格的文本内容(此行第一列的单元格就是td[1],第二列就是td[2],使用.text获取其文本内容,注意:使用row.xpath获取出的是一个列表,需要加一个[0]来成为单个元素)。

http://www.dtcms.com/wzjs/354139.html

相关文章:

  • 做黑彩网站赚钱吗互联网广告营销是什么
  • 自己做的网站二维码怎么做的自助建站网
  • 目前做汽配的网站有哪些线上推广渠道主要有哪些
  • 长沙网站建设市场低价网络推广有多少种方法
  • 网站后台管理员怎么做国内广告联盟平台
  • 深圳品牌做网站公司哪家好今日头条新闻最全新消息
  • 佳木斯网站设计花都网站建设公司
  • 自己做网站靠什么赚钱网络整合营销是什么意思
  • b2c电商网站开发提高网站排名
  • 现在网站都是拿什么软件做的目前推广平台都有哪些
  • 长春网站建设翻译qq群推广网站
  • 领导不愿意做招聘网站怎么办搜索引擎优化策略包括
  • 买花网站代码优化设计答案五年级上册
  • 做微博长图的网站web制作网站的模板
  • 优质手机网站建设企业怎么开发自己的网站
  • 好的高端网站网络推广外包公司排名
  • 广西桂林最新事件天津的网络优化公司排名
  • 广州软件园 网站建设东莞发布最新通告
  • 网站多级栏目关于校园推广的软文
  • 百度推广做的网站可以用吗深圳百度seo怎么做
  • 无锡网站制作seo资讯推推蛙
  • 哪家做网站靠谱线上培训平台
  • 如何做网站模版如何找做网站的公司
  • 礼品公司怎么做网站陕西百度代理公司
  • 栾川住房和城乡建设委员会网站宁波seo优化报价多少
  • 同样也是做严选的网站网络推广软文
  • vi设计手册范本谷歌seo搜索引擎
  • 搜索动图素材的网站如何做网站
  • 江西网站制作购物网站大全
  • 西安大网站建设公司排名百度整站优化