当前位置: 首页 > wzjs >正文

怡清源在慧聪网网站建设情况西安seo技术

怡清源在慧聪网网站建设情况,西安seo技术,临沂网站seo,广东哪家网站建设后台管理便捷前言 1.知识点碎片化:每个网站实现的技术相似但是有区别,要求我们根据不同的网站使用不同的应对手段。主要是常用的一些网站爬取技术。 2.学习难度:入门比web简单,但后期难度要比web难,在于爬虫工程师与网站开发及运维…

前言 

1.知识点碎片化:每个网站实现的技术相似但是有区别,要求我们根据不同的网站使用不同的应对手段。主要是常用的一些网站爬取技术。

2.学习难度:入门比web简单,但后期难度要比web难,在于爬虫工程师与网站开发及运维人员的对抗。比如你写了爬虫但是被网站运维人员发现后添加反爬,那么就要解决反爬。即平台更新换代,爬虫策略需要实时更新

3.学习特点:以摸个网站爬虫为讲解对象,即一个技术点的案例。

4.后续发展:要求掌握的东西多,工作中根据工作需要涉及到更多没有接触的知识。

5.法律层面:爬虫相关工作属于灰色地带,目前国内现行法律对于爬虫相关评判还没有明确制度。

6.建议:好记性不如烂笔头,建议多找网站进行爬取联系,同时做好笔记。


1 网络通信要素

1.1 什么是网络?

       网络‌是指将多个计算机或设备通过通信线路、传输协议和网络设备连接起来,形成一个相互通信和共享资源的系统。网络的基础定义包括多个节点通过某种方式相互连接而形成的系统,这些节点可以是计算机、服务器或其他电子设备。网络在计算机科学中特指将地理位置分散的多台计算机及其外部设备通过通信线路连接起来,实现资源共享和信息传递的系统。‌

1.2 学习网络的目的?

       更加深入的了解网络编程,掌握了网络才能在后面的爬虫发送请求阶段、及找出对应的反爬手段有自己的理解、自己的方法。  

2.IP地址

2.1.什么是IP地址?

IP地址是分配给网络设备上网使用的数字标签,它能解析网络中唯一的一台设备。

cmd 打开终端命令: ipconfig

2.2.IP地址的表现形式

‌IP地址主要有两种表现形式:IPv4 和 IPv6

IPv4 是目前使用的ip地址,IPv6 是未来使用的ip 地址。

IPv4是目前广泛使用的IP地址版本,采用点分十进制表示形式。一个IPv4地址由四个字节组成,每个字节的范围是0到255,字节之间用点(.)分隔。例如,常见的本地回环地址127.0.0.1。IPv4地址分为A、B、C、D、E五类,其中A、B、C类地址是最常用的:

  • A类地址‌:网络号占8位,主机号占24位,范围从1.0.0.0到126.255.255.255。
  • B类地址‌:网络号占16位,主机号占16位,范围从128.0.0.0到191.255.255.255。
  • C类地址‌:网络号占24位,主机号占8位,范围从192.0.0.0到223.255.255.255。

IPv6是为了解决IPv4地址枯竭而设计的下一代IP地址版本,采用冒号十六进制表示形式。一个IPv6地址由8组4字节的十六进制数组成,每组之间用冒号(:)分隔。例如,2001:0db8:85a3:0000:0000:8a2e:0370:7334。IPv6提供了更大的地址空间,理论上可以为地球上每一粒沙子分配一个唯一的IP地址。

2.3.IP地址的作用

通过IP地址找到网络中唯一的一台设备,然后就可以和该设备进行通信。

2.4.windows常用的几个cmd命令

        ipconfig:查看网卡信息
        ping ip/url地址: 检查是否能够上网
        dir 查看当前路径中有那些文件信息
        cls 清空终端信息
        cd 路径
            # .. 回到上一级目录
            # ./ 代表当前

1)ping baidu.com   检查是否能够上网 

2)ping 127.0.0.1  检查本地网卡是否正常

3)dir 查看当前路径中有那些文件信息

4)  cls 清空终端信息

3.端口

知识点:
    1.什么是端口?
    2.什么是端口号?
    3.知名端口号?
    4.动态端口号

3.1端口和端口号的介绍

       每运行一个程序都会有一个端口,想要给对应的程序发送数据,找到对应端口即可。相当于酒店的房间号。

       端口号:操作系统为了统一管理端口,就对端口进行了编号。端口号就是数字,好比房间号。端口号有65536个。

      最终通信流程,通过ip地址找到对应的设备,通过端口号 找到对应的端口,然后通过端口把数据给应用程序。 ip + port   如:127.0.0.1:8080

       

      端口是传输数据的通道,是数据传输的必经之路。

      端口号是用来管理区分不同端口的号码。

3.2 端口号的分类

    1)知名端口号:众所周知的端口号 0-1023,固定分配给一些服务,如21、22、80端口

    2)动态端口号:一般程序员开发应用程序使用的端口号,1024-65535,如果没指定则随机生成一个给开发的应用程序使用。

    当运行一个程序默认会有一个端口号,当该应用程序退出时,所占用的端口号会释放。

....下节开始进入编程。


http://www.dtcms.com/wzjs/428526.html

相关文章:

  • 天河门户网站建设公司企业网站推广的方法有
  • 门户网站建立流程nba赛季排名
  • 看想看的做想做的电影网站好口碑营销方案怎么写
  • 模板网站建站步骤外贸营销型网站制作公司
  • 无锡手机网站制作费用移动建站模板
  • 汉网网站建设推广普通话宣传周活动方案
  • 邯郸代办公司注册优化关键词排名
  • 销售网站建设百度指数关键词搜索趋势
  • 做智能网站营销话术网站怎么推广
  • 巴中市做网站开发网站建设公司
  • 深圳外贸网站建设口报关关键词挖掘机爱站网
  • 水务公司网站建设方案站内推广方式
  • 网站建设含意网络优化seo
  • 腾讯云可以做网站吗新网站推广方案
  • 阳江网站建设sem搜索引擎营销
  • 北京网站建设是什么意思百度公司招聘2022年最新招聘
  • 自己做的网站在浏览器上显示不安全seo排名技术教程
  • 东莞网站建设设计百度应用商店
  • 销售网站设计宣传推广策略
  • 网站设计协议营销策划的十个步骤
  • 电影网站模板htmlsem竞价推广是什么
  • 嵌入式开发就业前景成都网站优化公司
  • 网站建设平台招商广告联盟app下载赚钱
  • 怎么做网站平台梦想明年2024年有疫情吗
  • 成品网页成都搜索优化整站优化
  • 小企业网站维护什么东西北京专业seo公司
  • 企业网站开发公司-北京公司建网站需要多少钱和什么条件
  • b s网站系统如何做性能测试ip营销的概念
  • 女孩子读电子商务好就业吗信阳seo公司
  • wordpress的结构简述优化搜索引擎的方法