当前位置: 首页 > wzjs >正文

苏州网站建设优化婚纱摄影的网站怎么做

苏州网站建设优化,婚纱摄影的网站怎么做,m3u8插件 wordpress,横沥网站建设什么是代理 代理服务器 代理服务器的作用 就是用来转发请求和响应 在爬虫中为何需要使用代理? 有些时候,需要对网站服务器发起高频的请求,网站的服务器会检测到这样的异常现象,则会讲请求对应机器的ip地址加入黑名单&#xff…
  • 什么是代理

    • 代理服务器

  • 代理服务器的作用

    • 就是用来转发请求和响应

  • 在爬虫中为何需要使用代理?

    • 有些时候,需要对网站服务器发起高频的请求,网站的服务器会检测到这样的异常现象,则会讲请求对应机器的ip地址加入黑名单,则该ip再次发起的请求,网站服务器就不在受理,则我们就无法再次爬取该网站的数据。

    • 使用代理后,网站服务器接收到的请求,最终是由代理服务器发起,网站服务器通过请求获取的ip就是代理服务器的ip,并不是我们客户端本身的ip。

  • 代理的匿名度

    • 透明:网站的服务器知道你使用了代理,也知道你的真实ip

    • 匿名:网站服务器知道你使用了代理,但是无法获知你真实的ip

    • 高匿:网站服务器不知道你使用了代理,也不知道你的真实ip(推荐)

  • 代理的类型(重要)

    • http:该类型的代理服务器只可以转发http协议的请求

    • https:可以转发https协议的请求

  • 如何获取代理?

    • 携趣代理:ip代理_长短效动静态ip代理_优质高速在线ip代理_携趣网络代理ip服务商

  • 如何使用代理?

    • 测试:访问如下网址,返回自己本机ip

import requests
from lxml import etree
headers = {'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.80 Safari/537.36',
}
url = 'http://www.cip.cc/'page_text = requests.get(url,headers=headers).text
tree = etree.HTML(page_text)
text = tree.xpath('/html/body/div/div/div[3]/pre/text()')[0]
print(text.split('\n')[0])
  • 使用代理发起请求,查看是否可以返回代理服务器的ip
import requests
from lxml import etree
headers = {'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.80 Safari/537.36',
}
url = 'http://www.cip.cc/'page_text = requests.get(url,headers=headers,proxies={'http':'121.234.12.62:4246'}).text
tree = etree.HTML(page_text)
text = tree.xpath('/html/body/div/div/div[3]/pre/text()')[0]
print(text.split('\n')[0])
  •  代理池

最新问政-阳光热线问政平台

import request
from lxml import etree
import random
headers = {'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36',
}def get_proxy_pool():p_url = '代理提取的url'page_text = requests.get(p_url).textproxy_list = page_text.split('\r\n')return proxy_list
proxy_list = get_proxy_pool() #获取了代理池(列表)for page in range(1,100):url = 'https://wz.sun0769.com/political/index/politicsNewest?id=1&page=%d'%pagepage_text = requests.get(url,headers=headers,proxies={'https':random.choice(proxy_list)}).texttree = etree.HTML(page_text)ret = tree.xpath('/html/body/div[2]/div[3]/ul[2]/li[1]/span[3]/a/text()')[0]print(ret)

 

http://www.dtcms.com/wzjs/589001.html

相关文章:

  • 前端一般模仿什么网站前端开发入门培训
  • 网站建设浅析公司排名的网站
  • 杭州有做网站网站建设及安全管理
  • 网站建设 收费标准企业网站设计步骤
  • 宁德建设网站网页设计图片大小
  • 响应式网站建设多少钱wordpress音频播放器插件
  • 连接外国的网站吗网站主题模板下载
  • 刷粉网站开发产品摄影网站
  • 公司请人做公司网站会计分录外贸公司怎么做
  • 巴中做网站公司鱼的wordpress主题
  • 去百度建网站软件开发外包费用评估
  • 都有哪些不错的网页设计网站连云港关键字优化案例
  • 甘肃省住房和城乡建设局网站wordpress 页面列表显示
  • dw创建网站导航栏菜单怎么做网页技术开发设计
  • 网站案例上海品牌建设三年规划
  • 网站开发文档教学网站电话素材
  • 为什么企业建设银行网站打不开四川建设厅下载专区网站
  • 网站管理助手4.1wordpress自定义链接怎么配置
  • 电商网站架构网站城市跳转怎么做
  • 策划书中网站制作怎么写网站和平台是一个意思吗
  • 外国建筑网站莱芜都市网二手
  • mui做网站的好处广州外贸推广
  • 网站前期准备工作kusanagi wordpress
  • 奔驰宝马游戏网站建设程序员最低学历要求
  • 自己怎样做网站游览有关小城镇建设的网站
  • 商城网站源码免费温江区网站建设
  • 本地网站后台密码秦皇岛网络优化排名
  • 网站建设前端需要看什么书如何建设红色旅游网站
  • 网站备案 更改ip网站平台建设十大公司
  • 黄村做网站哪家好html5开发