当前位置: 首页 > wzjs >正文

企业市场营销徐州seo推广

企业市场营销,徐州seo推广,做外贸出口衣服的网站,江西seo什么是代理 代理服务器 代理服务器的作用 就是用来转发请求和响应 在爬虫中为何需要使用代理? 有些时候,需要对网站服务器发起高频的请求,网站的服务器会检测到这样的异常现象,则会讲请求对应机器的ip地址加入黑名单&#xff…
  • 什么是代理

    • 代理服务器

  • 代理服务器的作用

    • 就是用来转发请求和响应

  • 在爬虫中为何需要使用代理?

    • 有些时候,需要对网站服务器发起高频的请求,网站的服务器会检测到这样的异常现象,则会讲请求对应机器的ip地址加入黑名单,则该ip再次发起的请求,网站服务器就不在受理,则我们就无法再次爬取该网站的数据。

    • 使用代理后,网站服务器接收到的请求,最终是由代理服务器发起,网站服务器通过请求获取的ip就是代理服务器的ip,并不是我们客户端本身的ip。

  • 代理的匿名度

    • 透明:网站的服务器知道你使用了代理,也知道你的真实ip

    • 匿名:网站服务器知道你使用了代理,但是无法获知你真实的ip

    • 高匿:网站服务器不知道你使用了代理,也不知道你的真实ip(推荐)

  • 代理的类型(重要)

    • http:该类型的代理服务器只可以转发http协议的请求

    • https:可以转发https协议的请求

  • 如何获取代理?

    • 携趣代理:ip代理_长短效动静态ip代理_优质高速在线ip代理_携趣网络代理ip服务商

  • 如何使用代理?

    • 测试:访问如下网址,返回自己本机ip

import requests
from lxml import etree
headers = {'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.80 Safari/537.36',
}
url = 'http://www.cip.cc/'page_text = requests.get(url,headers=headers).text
tree = etree.HTML(page_text)
text = tree.xpath('/html/body/div/div/div[3]/pre/text()')[0]
print(text.split('\n')[0])
  • 使用代理发起请求,查看是否可以返回代理服务器的ip
import requests
from lxml import etree
headers = {'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.80 Safari/537.36',
}
url = 'http://www.cip.cc/'page_text = requests.get(url,headers=headers,proxies={'http':'121.234.12.62:4246'}).text
tree = etree.HTML(page_text)
text = tree.xpath('/html/body/div/div/div[3]/pre/text()')[0]
print(text.split('\n')[0])
  •  代理池

最新问政-阳光热线问政平台

import request
from lxml import etree
import random
headers = {'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36',
}def get_proxy_pool():p_url = '代理提取的url'page_text = requests.get(p_url).textproxy_list = page_text.split('\r\n')return proxy_list
proxy_list = get_proxy_pool() #获取了代理池(列表)for page in range(1,100):url = 'https://wz.sun0769.com/political/index/politicsNewest?id=1&page=%d'%pagepage_text = requests.get(url,headers=headers,proxies={'https':random.choice(proxy_list)}).texttree = etree.HTML(page_text)ret = tree.xpath('/html/body/div[2]/div[3]/ul[2]/li[1]/span[3]/a/text()')[0]print(ret)

 

http://www.dtcms.com/wzjs/369244.html

相关文章:

  • 产品推销文案福州短视频seo平台
  • 网络科技公司主要做什么合肥seo搜索优化
  • 域名注册好后怎么建设网站谷歌关键词工具
  • 投资担保网站建设网站开发的步骤
  • 黄山新洲建设集团网站专注于seo顾问
  • 给别人做网站用什么网页制作图片
  • 乡镇可以做门户网站360优化大师历史版本
  • 怎样在手机上面建设网站关键词排名工具有哪些
  • 建设自己的淘宝优惠券网站网站建设公司大型
  • 企业网站制作免费网络营销策略主要包括
  • 亚马逊做品牌备案自有网站重庆森林为什么不能看
  • 苏州建设网站制作电商网站商品页的优化目标是什么
  • 做爰全过程免费的视频99网站微信公众号推广方法有哪些
  • 佛山房地产网站建设关键词优化排名详细步骤
  • 如何创作个人网站手机免费发布信息平台
  • 聊城网站设计爱论坛
  • 网站建站中关键字搜索怎么弄关键词排名方法
  • 淄博网站推广哪家好东莞网站建设做网站
  • 网站建设费一般是什么费用衡水seo优化
  • 做下载网站有哪些提交网址给百度
  • 网站限制浏览次数是怎么做的免费查权重工具
  • 做机械有什么兼职网站合肥网站推广
  • flash企业网站搜索app下载
  • 建站工具官网2021网络营销成功案例
  • dede网站地图 调用文章seo网址超级外链工具
  • 广西住房与城乡建设厅网站百度推广首页
  • 昆山网站制作nba最新排行榜
  • 网盘做网站空间友情链接交换源码
  • 北京城乡建设门户网站新手电商运营从哪开始学
  • 小说网站系统怎么做浙江网络科技有限公司