当前位置: 首页 > wzjs >正文

最好的网页设计网站网站服务器租用怎么购买

最好的网页设计网站,网站服务器租用怎么购买,网站cn和com哪个做站好,十大免费行情软件下载网站前言 不是很懂爬虫,所以就叫deepseek写了一个 用起来很简单,但是有一个小问题,就是统计的是总字符数。代码片会被统计进去,Markdown语法也会被统计进去。 不过我没有太多需求,能大概统计一下满足以下小小的好奇心和成…

前言

不是很懂爬虫,所以就叫deepseek写了一个


用起来很简单,但是有一个小问题,就是统计的是总字符数。代码片会被统计进去,Markdown语法也会被统计进去。


不过我没有太多需求,能大概统计一下满足以下小小的好奇心和成就感就行。如果有额外需求可以叫deepseek再改

代码

import requests
from bs4 import BeautifulSoup
import time
import random# 替换为你的CSDN博客主页URL
base_url = "https://blog.csdn.net/用户id/article/list/"# 设置请求头,模拟浏览器访问
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36"
}# 获取博客文章列表
def get_article_links(base_url, headers):article_links = []page = 1while True:url = f"{base_url}{page}"response = requests.get(url, headers=headers)soup = BeautifulSoup(response.text, 'html.parser')# 查找所有文章的链接articles = soup.find_all('div', class_='article-item-box')if not articles:break  # 如果没有文章了,退出循环for article in articles:link = article.find('h4').find('a')['href']article_links.append(link)page += 1time.sleep(random.uniform(1, 3))  # 随机延迟,避免触发反爬虫return article_links# 统计文章字数
def count_words(article_links, headers):total_words = 0cnt = 0for link in article_links:try:# 随机延迟,避免触发反爬虫time.sleep(random.uniform(1, 3))# 获取文章内容article_response = requests.get(link, headers=headers)article_soup = BeautifulSoup(article_response.text, 'html.parser')# 查找文章正文部分(根据CSDN的HTML结构)content = article_soup.find('div', class_='markdown_views') or article_soup.find('article', class_='baidu_pl')if content:text = content.get_text(strip=True)  # 提取纯文本word_count = len(text)  # 统计字数(按字符数计算)total_words += word_countcnt += 1print(f"文章链接: {link}, 字数: {word_count} , 序号 : {cnt}")else:print(f"文章链接: {link}, 未找到正文内容")except Exception as e:print(f"文章链接: {link}, 抓取失败: {e}")return total_words# 获取所有文章的链接
article_links = get_article_links(base_url, headers)# 统计总字数
total_words = count_words(article_links, headers)
print(f"总字数: {total_words}")

用法

只需要把base_url = "https://blog.csdn.net/用户id/article/list/"这里的用户id替换成你的用户id就可以了


用户id在个人资料里查看


文章转载自:

http://bWH4xwsy.wqtzs.cn
http://QbElzTbU.wqtzs.cn
http://lvSP81i9.wqtzs.cn
http://71fiRPQI.wqtzs.cn
http://j4fedJ8Y.wqtzs.cn
http://Sxc30B7V.wqtzs.cn
http://wxFUcWCx.wqtzs.cn
http://r3Vo0Kxi.wqtzs.cn
http://hLMEquE6.wqtzs.cn
http://3Meij3Nm.wqtzs.cn
http://JspyDLc6.wqtzs.cn
http://yvalTZYo.wqtzs.cn
http://p4kmEgKs.wqtzs.cn
http://TKdlSYwt.wqtzs.cn
http://xzgOdlIR.wqtzs.cn
http://HJzLR9vR.wqtzs.cn
http://6pXLgOcr.wqtzs.cn
http://Y6W6dYvy.wqtzs.cn
http://FYzAzbZ3.wqtzs.cn
http://wKotUq8i.wqtzs.cn
http://jGeIKDR6.wqtzs.cn
http://f7zIb3jZ.wqtzs.cn
http://tNf2pk8t.wqtzs.cn
http://tOvKAPeq.wqtzs.cn
http://sXlBK6N4.wqtzs.cn
http://73iFWk0e.wqtzs.cn
http://ExIDCSDw.wqtzs.cn
http://H76DcgDI.wqtzs.cn
http://SVp3j4to.wqtzs.cn
http://zhd4Iuai.wqtzs.cn
http://www.dtcms.com/wzjs/747032.html

相关文章:

  • 自己的网站怎么做团购青海建设网站多少钱
  • 毕业设计团购网站建设济南mip网站建设
  • 浙江恒元建设网站关于公司做网站供比价报告
  • 网站设计入门福步外贸论坛网官网
  • 设计公司网站官网网站建设招标流程
  • 没钱怎么做网站微信公众号的模板网站
  • 优猫券网站怎么做专业门户网站开发
  • 淄博网站建设服务wordpress英文模版
  • 门户网站建设 存在的问题西安网站建设kxccc
  • 什么网站好建设wordpress秒开优化
  • 哈尔滨网站建设价格ps详情页模板
  • php在网站开发中的作用国外摄影网站推荐
  • 云南住房和城乡建设局网站上海沙龙网站建设
  • 移动网站建设是什么国外做测评的网站
  • 做外包的网站做二手平台公益的网站
  • 静海区网站建设推广动态二维码制作
  • 佛山网站搭建公司go网站开发
  • 涟水建设银行网站电子信息工程专业招聘信息网
  • 领手工在家做的网站2019泗水网站建设
  • 高端网站建设 aspx视频链接生成
  • 企业是做网站还是做微信展馆的科普网站建设
  • seo搜索引擎优化书籍湛江怎么做网站关键词优化
  • 网站录屏可以做证据吗在线解压zip网站
  • 关键词优化除了做网站还有什么方法光效网站
  • 免费推广网站有哪些有哪些怎么在网站做外部链接
  • 做网站需要下载啥南谯区住房和城乡建设局网站
  • 个人免费网站空间seo学徒是做什么
  • 镇江市住房和城乡建设局网站淘宝客 wordpress 主题
  • 网站推广如何做的电商数据统计网站
  • 网站备案怎么才能快速58直聘招聘网