当前位置: 首页 > wzjs >正文

网站被k 但收录内页网站实施建设流程

网站被k 但收录内页,网站实施建设流程,优秀网站设计案例,做放单网站Requests库初步尝试 #导入requests库 import requests #requests.get读取百度网页 rrequests.get(http://www.baidu.com) #输出读取网页状态 print(r.status_code) #输出网页源代码 print(r.text) HTTP 状态码是三位数字,用于表示 HTTP 请求的结果。常见的状态码有…

Requests库初步尝试

#导入requests库
import requests
#requests.get读取百度网页
r=requests.get('http://www.baidu.com')
#输出读取网页状态
print(r.status_code)
#输出网页源代码
print(r.text)

HTTP 状态码是三位数字,用于表示 HTTP 请求的结果。常见的状态码有:

  • 200:表示请求成功。
  • 404:表示请求的资源不存在。
  • 500:表示服务器内部出错。

所以只有200是成功,其他都是失败!

运行代码看到200成功读取网页,并解读了网页源代码

一、Requests库主要七个方法

 

1、 requests.get('http://www.baidu.com')

这就是刚开始我们获取百度网页的方法,非常常用。

注意这里的网址是要http开头的,如果只有www则会报错

#输出r对象的类型,即requests.models.Response
print(type(r))
#输出HTTP 头部信息
print(r.headers)

2、六个方法之间关系

3、PATCHPUT区别

  假设URL位置有一组数据UserInfo,包括UserID、UserName等20个字段

需求:用户修改了UserName,其他不变

  • 采用PATCH,仅向URL提交UserName的局部更新请求(局部改)
  • 采用PUT,必须将所有20个字段一并提交到URL,未提交字段被删除(整体改)

PATCH的最主要好处:节省网络带宽

二、Response对象的属性

 让我们来解读一下网页的编码方式:

import requests
r=requests.get('https://www.sina.com.cn/')
print(r.status_code)
print(r.text)
#输出网页header中得出的编码方式
print(r.encoding)
#输出网页内容中分析得出的编码方式
print(r.apparent_encoding)

可以看到解析内容看不懂

r.encoding得出新浪的编码方式 ISO-8859-1
r.apparent_encoding分析出新浪推测的编码方式utf-8

在中文网页中只有utf-8才能读出内容

当我们在代码中添加r.encoding = 'utf-8' 才可以解读出网页内容

 

三、Response库可能发生的异常

 

四、★★★爬取网页的通用代码框架

这是一个通用的代码:

import requestsdef getHTMLText(url):try:r=requests.get(url,timeout=30)r.raise_for_status()    #如果状态不是200,引发HTTPError异常r.encoding=r.apparent_encodingreturn r.textexcept:return "产生异常"if __name__=='__main__':url='https://www.sina.com.cn/'print(getHTMLText(url))

运行代码可得

如果在网站中删除http则会报错

 

五、HTTP协议

HTTP是一个基于“请求与响应”模式的、无状态的应用层协议

HTTP协议采用URL作为定位网络资源的标识,URL格式如下:

http://host[:port][path]

  • host: 合法的Internet主机域名或IP地址
  • port: 端口号,缺省端口为80
  • path: 请求资源的路径

URL是通过HTTP协议存取资源的Internet路径,一个URL对应一个数据资源

六、总结

  • r.status_code:200是成功
  • requests.get('http://www.baidu.com')
  • PATCH局部更新   /  PUT全局更新
  • r.encoding得出编码方式
  • r.apparent_encoding推测编码方式
  • 添加r.encoding = 'utf-8' 才可以解读出网页内容
  • 爬虫通用代码框架:

import requests

def getHTMLText(url):
    try:
        r=requests.get(url,timeout=30)
        r.raise_for_status()    #如果状态不是200,引发HTTPError异常
        r.encoding=r.apparent_encoding
        return r.text
    except:
        return "产生异常"

if __name__=='__main__':
    url='https://www.sina.com.cn/'
    print(getHTMLText(url))


文章转载自:

http://9hUQLKZ8.Lswgs.cn
http://9ECBKEzp.Lswgs.cn
http://XWXBt7Y6.Lswgs.cn
http://cNtO5FN4.Lswgs.cn
http://3yQmI2OB.Lswgs.cn
http://rU1cDOgR.Lswgs.cn
http://G3Qfm1jj.Lswgs.cn
http://TqTxN0tp.Lswgs.cn
http://RroeY0O0.Lswgs.cn
http://5QvuEAZQ.Lswgs.cn
http://HRhFxCpd.Lswgs.cn
http://cwvSY0MQ.Lswgs.cn
http://RoOXKa33.Lswgs.cn
http://lnLlHrbQ.Lswgs.cn
http://AKnsKmaB.Lswgs.cn
http://ehL8Z1tj.Lswgs.cn
http://aclxzLm8.Lswgs.cn
http://883Kr2bJ.Lswgs.cn
http://r9pF9e8T.Lswgs.cn
http://Oy5olABi.Lswgs.cn
http://wVi9qned.Lswgs.cn
http://eo8flswr.Lswgs.cn
http://iFcx5kKk.Lswgs.cn
http://baRAaIED.Lswgs.cn
http://5s5BtMB3.Lswgs.cn
http://pQGq5nFa.Lswgs.cn
http://F1EDmZEO.Lswgs.cn
http://5j4S0p2S.Lswgs.cn
http://WyDNq2zP.Lswgs.cn
http://ZbH9qtgZ.Lswgs.cn
http://www.dtcms.com/wzjs/703301.html

相关文章:

  • 湖北定制型网站建设项目宣传推广方案
  • 鞋帽网站欣赏自己在线制作logo免费模版
  • 重庆网站备案最快几天自己网站做问卷调查问卷
  • 自建博客网站企业网站建设合同应注意什么
  • 浙江中联建设集团网站网络搭建是干什么的
  • 大一做家教的网站wordpress 注册验证码
  • 网销网站建设流程在线网页刷新
  • 网站开发可选择的方案有哪些网站建设流程图viso
  • 一个网站的百度反链多好还是少好厦门网站建设seo
  • 网站建设主要由哪几个部分组成游戏软件开发需要学什么专业
  • 湖南正规关键词优化南京seo建站
  • 湖南网站建设公司 地址磐石网络淘客做网站多少钱
  • 微企业网站模板免费互联网网站模版
  • 怎么做网站差不多站长seo具体怎么优化
  • 省建设干部培训中心网站西昌城乡规划与建设局网站
  • wordpress站点实例做网站必须要注册公司么
  • 廊坊网站快速排名优化账号注册登录立即注册
  • 企业网站模板编辑软件新品发布会一般在哪里举行
  • 张家港市建设局网站做国外网站选择vps
  • 服务周到的网站建站脑洞大开的创意设计
  • 长治市网站开发设计公司网站需要多少钱
  • 网站内容如何自动关联新浪微博360搜图片识图
  • dede建设网站网店美工主要负责什么工作
  • 黄岩做网站的公司深圳英文网站制作
  • 做网站得每年续费吗旅游网页设计说明
  • linux wordpress配置百度关键词seo
  • 湖南网站建设磐石网络口碑好公众号编辑器哪个好用
  • 接口网站开发龙岩网站优化费用
  • 做株洲网站需要多少钱温州seo网站建设
  • 海口网站建设找千素网做旅游网站能成功