当前位置: 首页 > wzjs >正文

有什么做视频的免费素材网站互联网营销模式

有什么做视频的免费素材网站,互联网营销模式,网站图片批量上传,b2b网站开发技术文档一、使用HTTP服务代理 由于网络环境、网站对用户的访问速度的限制等原因,使得爬取过程会出现IP被封禁,故使用代理可提高爬取速度。在Scrapy中提供了一个HttpProxyMiddleware专门用于进行爬虫代理设置。在使用该代理进行爬取操作时,需要先在ba…

一、使用HTTP服务代理

由于网络环境、网站对用户的访问速度的限制等原因,使得爬取过程会出现IP被封禁,故使用代理可提高爬取速度。在Scrapy中提供了一个HttpProxyMiddleware专门用于进行爬虫代理设置。在使用该代理进行爬取操作时,需要先在bash中设置好系统环境变量,然后使用该代理设置自动默认获取*****_proxy的路径作为代理路径此外,还可以实现使用多个代理。

二、redis使用

在Ubuntu中使用apt-get对redis进行安装。

其安装指令为:sudo apt-get install redis-server

其开启/重启、停止服务器指令为:sudo service redis-server start/restart/start

redis默认在127.0.0.1:6379上开启服务,可以使用netstat -ntl命令进行查询。如果想让其他的计算机被监听和访问,可以在redis配置文件/etc/redis/redis.conf中对监听地址进行修改和扩展,使用redis-cli-h IP地址 -p 端口号,来链接服务器;查看链接数据库是否成功使用PING,若返回PONG,则说明连接成功。相关redis的官方文档为:Redis - The Real-time Data Platform

redis支持五种Key类型:字符串、列表、字典,有序字典、哈希。此外,除了在ubuntu中可以使用redis,在python中也可使用redis,使用sudo pip install redis即可,然后import redis导入使用即可。

三、通过Scrapy实现分布式爬取

使用scrapy-redis实现分布式爬取,分布式的本质就是“人多力量大”,首先找到可以使用的多个LINIX主机并获取各主机的IP地址,然后在各个主机中安装scrapy和scrapy-redis

安装指令为:pip install scarpy;pip install scrapy-redis,从多个主机中选择一个作为供所有爬虫使用的redis数据库,并在该主机上安装redis-server;然后在redis配置文件(/etc/redis/redis.conf)中修改服务器的地址,确保该数据库能被所有的爬虫进行访问;然后重启redis服务器即可。然后测试多个主机能否访问设定为redis数据库的主机(redis-cli -h IP地址 ping,返回为PONG则说明连接成功)

http://www.dtcms.com/wzjs/451039.html

相关文章:

  • 防腐木做水车网站武汉seo网站优化运营
  • 手表网站排名前十游戏推广可以做吗
  • 免费网站空间免备案短链接
  • 静安西安网站建设如何广告推广
  • ps 如何做网站深圳网络推广收费标准
  • 青海格尔木建设局网站好口碑的关键词优化
  • 湖南省社会保险网站网站如何做关键词优化
  • pta编程网站seo托管服务
  • 叮当网站做app南宁白帽seo技术
  • wordpress主题破解版网站如何做优化推广
  • 手机wap网站模板免费网络推广平台
  • 电子商务网站建设意义网络销售怎么做才能做好
  • 漳州找人做网站要求哪些今日全国最新疫情通报
  • 网站品牌建设方案重庆网站seo好不好
  • 郑州it渠道网网站优化教程
  • 做数据表格的网站seo基础培训机构
  • 大连企业网站易观数据
  • 注册域名是什么意思seo工作室
  • 高端品牌网站建设兴田德润在那里微信朋友圈营销文案
  • 重庆美邦 网站建设seo案例视频教程
  • 编程入门教程seo平台是什么意思
  • seo网络推广外包公司北京seo培训机构
  • 做视频网站该把视频文件传到哪产品营销策划方案
  • 哪些网站是用php编写的键词优化排名
  • 网站开发更新记录沈阳关键词快照优化
  • 专为中年人做的的婚恋网站代码优化
  • 合肥哪个公司做网站好深圳seo优化服务商
  • 做网站公司怎么推销chatgpt 网站
  • 湛江做网站seo的百度软件中心下载
  • 重庆网站优化排名软件方案关键词搜索引擎又称为