当前位置: 首页 > wzjs >正文

网站建设要些什么公司排名的网站

网站建设要些什么,公司排名的网站,网络管理系统平台有哪些,网站建设丂金手指科杰Tip 这是一个非常简单的小说网站,读者可以拿来练习爬虫,练习xpath,文章内不让带网址,私信我获取网址。代码里有详细注释。 代码 import requests as r from lxml import etree import re## 根网址 base_url "xxx"##…

Tip

  • 这是一个非常简单的小说网站,读者可以拿来练习爬虫,练习xpath,文章内不让带网址,私信我获取网址。代码里有详细注释。

代码

import requests as r
from lxml import etree
import re## 根网址
base_url = "xxx"## 小说id,即小说目录地址后的那一串数字
content_id = "xxx"## 下载路径及文件名
myFile= "./小说名.txt"## 获取html
items = r.get(base_url + "/" + content_id).text
html_body = etree.HTML(items).xpath("/html/body")## 获取小说目录
## 这里采用了xpath的方式获取到类为listmain的div,并获取到其内部的dl,然后获取第二个dt之后的所有dd标签,获取每个dd标签下的a标签的href即为小说每一章的地址。
href = html_main.xpath("//div[@class='listmain']/dl/dt[2]/following-sibling::dd//a/@href")## 打开文件并追加写入每一章的标题和内容,记得在最后处理一下\n\t和一些其它编码符。(可以适当添加延迟或者参考笔者之前的代理ip博客使用代理ip,否则可能会出现访问超时)
with open(myFile,"a", encoding="utf-8") as f:for item in href:res_content = ""# 拼接urlurl = base_url+itemresponse = r.get(url).textres_html = etree.HTML(response)title = res_html.xpath("//div[@class='content']/h1/text()")[0]print("正在下载:"+title)res_content+=titleres_content+='\n'contents = res_html.xpath("//div[@id='content']/text()")for content in contents:trans_content = re.sub(r'\xa0', '', content)res_content += content.replace("\xa0","").replace('\r','\t')res_content+='\n'f.write(res_content)print("下载完成")

其它爬虫文章

记一次用Python爬取代理IP并使用(尝试用代理IP制造直播房间访问量)
记一次用Python统计全国女性Size
Python爬虫——爬取阳光高考专业数据并对所有专业进行数据分析


文章转载自:

http://Sel8onjE.fwcjy.cn
http://eywAzGR9.fwcjy.cn
http://9lMpdBzy.fwcjy.cn
http://yec8fKUL.fwcjy.cn
http://Itk3Zq0d.fwcjy.cn
http://hy0TSR0z.fwcjy.cn
http://udfmGnbH.fwcjy.cn
http://7iCJE671.fwcjy.cn
http://H9D3HBv4.fwcjy.cn
http://M35CNqdy.fwcjy.cn
http://GQboc5b5.fwcjy.cn
http://i1MUB0fa.fwcjy.cn
http://y7NB1hSQ.fwcjy.cn
http://FHwK0jpP.fwcjy.cn
http://PehUahuB.fwcjy.cn
http://teXLosdO.fwcjy.cn
http://Y3yZkLbh.fwcjy.cn
http://eucElZrh.fwcjy.cn
http://OansmHxi.fwcjy.cn
http://U8Vnon18.fwcjy.cn
http://JKpPA5qW.fwcjy.cn
http://vYISi8xl.fwcjy.cn
http://iWt53RnY.fwcjy.cn
http://z6fuz94L.fwcjy.cn
http://d7MOFgid.fwcjy.cn
http://QJgwApOj.fwcjy.cn
http://UPQo3JQS.fwcjy.cn
http://EMEPz1ay.fwcjy.cn
http://vFOBwVkH.fwcjy.cn
http://oOuZNtGc.fwcjy.cn
http://www.dtcms.com/wzjs/660098.html

相关文章:

  • 怎么做刷会员的网站企业网站seo参考文献
  • 工会网站建设可以wordpress 杂志 主题
  • 网站更多分享怎么做沈阳出名网站
  • 阜平网站建设东道设计招聘要求
  • 娄底企业网站建设制作php网站建设安装环境
  • 专业 网站建设美丽深圳公众号二维码原图
  • 网站改标题降权朝阳企业网站建设方案费用
  • 旅游网站设计模板图片做个企业网站多少钱
  • 西安做网站推广100个最全的免费网站
  • 如何做网站的源码网页设计总结与体会200字
  • wordpress网站字体禁忌网站
  • 做移动网站优化快速排名软件seo人才
  • 品牌网站建设小蝌蚪1a网络营销理论主要包括
  • 怎么组建企业网站如何做区块链网站
  • 常见的门户网站有哪些2023年8月份新冠
  • 学做网站要学什么网站都有什么类型的
  • 重庆网站seo案例wordpress同步微信公众号
  • 重庆网站设计智能 乐云践新域名价值
  • 首钢建设一公司网站制作一般网站
  • 论坛网站开发的目的和意义用什么系统程序做评测网站
  • 保定制作公司网站的公司亚马逊雨林的原始部落
  • 网站开发公司郑州网站开发一般会使用框架吗
  • 58同城网站建设要多少钱网站应该设计成什么样
  • wordpress怎么编辑网站泸州市建设厅网站
  • 郑州做网站狼牙推广运营工作内容
  • 站长之家查询的网址网站开发报告书
  • 谁会做网站排名校园网站建设硬件采购
  • 个人做网站的流程网站建设费进项税金可以抵扣吗
  • 合肥品牌网站商务网站的建设与维护
  • 建立网站难吗网页美工设计的工作流程?