当前位置: 首页 > wzjs >正文

网站优化排名的方法东莞网站竞价推广

网站优化排名的方法,东莞网站竞价推广,WordPress表情问题,营销型企业网站建设与推广什么是代理 代理服务器 代理服务器的作用 就是用来转发请求和响应 在爬虫中为何需要使用代理? 有些时候,需要对网站服务器发起高频的请求,网站的服务器会检测到这样的异常现象,则会讲请求对应机器的ip地址加入黑名单&#xff…
  • 什么是代理

    • 代理服务器

  • 代理服务器的作用

    • 就是用来转发请求和响应

  • 在爬虫中为何需要使用代理?

    • 有些时候,需要对网站服务器发起高频的请求,网站的服务器会检测到这样的异常现象,则会讲请求对应机器的ip地址加入黑名单,则该ip再次发起的请求,网站服务器就不在受理,则我们就无法再次爬取该网站的数据。

    • 使用代理后,网站服务器接收到的请求,最终是由代理服务器发起,网站服务器通过请求获取的ip就是代理服务器的ip,并不是我们客户端本身的ip。

  • 代理的匿名度

    • 透明:网站的服务器知道你使用了代理,也知道你的真实ip

    • 匿名:网站服务器知道你使用了代理,但是无法获知你真实的ip

    • 高匿:网站服务器不知道你使用了代理,也不知道你的真实ip(推荐)

  • 代理的类型(重要)

    • http:该类型的代理服务器只可以转发http协议的请求

    • https:可以转发https协议的请求

  • 如何获取代理?

    • 携趣代理:ip代理_长短效动静态ip代理_优质高速在线ip代理_携趣网络代理ip服务商

  • 如何使用代理?

    • 测试:访问如下网址,返回自己本机ip

import requests
from lxml import etree
headers = {'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.80 Safari/537.36',
}
url = 'http://www.cip.cc/'page_text = requests.get(url,headers=headers).text
tree = etree.HTML(page_text)
text = tree.xpath('/html/body/div/div/div[3]/pre/text()')[0]
print(text.split('\n')[0])
  • 使用代理发起请求,查看是否可以返回代理服务器的ip
import requests
from lxml import etree
headers = {'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.80 Safari/537.36',
}
url = 'http://www.cip.cc/'page_text = requests.get(url,headers=headers,proxies={'http':'121.234.12.62:4246'}).text
tree = etree.HTML(page_text)
text = tree.xpath('/html/body/div/div/div[3]/pre/text()')[0]
print(text.split('\n')[0])
  •  代理池

最新问政-阳光热线问政平台

import request
from lxml import etree
import random
headers = {'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36',
}def get_proxy_pool():p_url = '代理提取的url'page_text = requests.get(p_url).textproxy_list = page_text.split('\r\n')return proxy_list
proxy_list = get_proxy_pool() #获取了代理池(列表)for page in range(1,100):url = 'https://wz.sun0769.com/political/index/politicsNewest?id=1&page=%d'%pagepage_text = requests.get(url,headers=headers,proxies={'https':random.choice(proxy_list)}).texttree = etree.HTML(page_text)ret = tree.xpath('/html/body/div[2]/div[3]/ul[2]/li[1]/span[3]/a/text()')[0]print(ret)

 

http://www.dtcms.com/wzjs/571289.html

相关文章:

  • 白云品牌型网站建设wordpress如何使用
  • 视频网站开发价格北京上海网站建设公司哪家好
  • 蛋糕店网站建设微商货源网下载
  • 济源网站开发wordpress自动回复插件
  • 织梦网站地图自动更新网站开发公司福建
  • 网站建设 招聘需求郑州网站seo外包
  • 娱乐公司网站建设价格推广网站利润
  • 网站建设综合安阳网站公司
  • 企业网站管理系统aspwordpress搭建镜像
  • 公司网站建设论文广告传媒公司介绍
  • 学校网站建设方案图片企业网站的作用
  • 高端网站设计有哪些模板网站如何建站
  • 化妆品网站优化昆明官网seo公司
  • 惠州市建网站公司昆明seo和网络推广
  • 做网站有什么书wordpress搜索按钮
  • 网站框架怎么设计河源网站建设
  • 旅游网站建设项目策划书怎么查网站关键词排名
  • 自己怎样开网站常熟网页设计报价
  • 建湖网站设计现在黄金多少钱一克
  • 网站开发建设招聘要求square wordpress
  • 做的网站怎么打开是白板上海频道网站建设公司
  • 商城网站实例企业信用公示信息网官网网址
  • 电力建设规范下载网站企业型商务网站制作做法
  • 网站开发培训北京seo搜外
  • 中国建设工程造价网站免费建立自己微网站
  • 网站网页区别是什么wordpress怎么static
  • 邢台市做网站wordpress mo
  • 吉林哪里做网站2017网络公司排名
  • 怎么用vs2010做网站漂亮的html页面源码
  • 网站的建设主题网页制作软件2023