当前位置: 首页 > wzjs >正文

响站怎么建设网站html5移动网站模板

响站怎么建设网站,html5移动网站模板,怎么做谷歌收录的网站,网站的404如何做前言 不是很懂爬虫,所以就叫deepseek写了一个 用起来很简单,但是有一个小问题,就是统计的是总字符数。代码片会被统计进去,Markdown语法也会被统计进去。 不过我没有太多需求,能大概统计一下满足以下小小的好奇心和成…

前言

不是很懂爬虫,所以就叫deepseek写了一个


用起来很简单,但是有一个小问题,就是统计的是总字符数。代码片会被统计进去,Markdown语法也会被统计进去。


不过我没有太多需求,能大概统计一下满足以下小小的好奇心和成就感就行。如果有额外需求可以叫deepseek再改

代码

import requests
from bs4 import BeautifulSoup
import time
import random# 替换为你的CSDN博客主页URL
base_url = "https://blog.csdn.net/用户id/article/list/"# 设置请求头,模拟浏览器访问
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36"
}# 获取博客文章列表
def get_article_links(base_url, headers):article_links = []page = 1while True:url = f"{base_url}{page}"response = requests.get(url, headers=headers)soup = BeautifulSoup(response.text, 'html.parser')# 查找所有文章的链接articles = soup.find_all('div', class_='article-item-box')if not articles:break  # 如果没有文章了,退出循环for article in articles:link = article.find('h4').find('a')['href']article_links.append(link)page += 1time.sleep(random.uniform(1, 3))  # 随机延迟,避免触发反爬虫return article_links# 统计文章字数
def count_words(article_links, headers):total_words = 0cnt = 0for link in article_links:try:# 随机延迟,避免触发反爬虫time.sleep(random.uniform(1, 3))# 获取文章内容article_response = requests.get(link, headers=headers)article_soup = BeautifulSoup(article_response.text, 'html.parser')# 查找文章正文部分(根据CSDN的HTML结构)content = article_soup.find('div', class_='markdown_views') or article_soup.find('article', class_='baidu_pl')if content:text = content.get_text(strip=True)  # 提取纯文本word_count = len(text)  # 统计字数(按字符数计算)total_words += word_countcnt += 1print(f"文章链接: {link}, 字数: {word_count} , 序号 : {cnt}")else:print(f"文章链接: {link}, 未找到正文内容")except Exception as e:print(f"文章链接: {link}, 抓取失败: {e}")return total_words# 获取所有文章的链接
article_links = get_article_links(base_url, headers)# 统计总字数
total_words = count_words(article_links, headers)
print(f"总字数: {total_words}")

用法

只需要把base_url = "https://blog.csdn.net/用户id/article/list/"这里的用户id替换成你的用户id就可以了


用户id在个人资料里查看


文章转载自:

http://h9m1HVK0.hfrbt.cn
http://iPLwr2ev.hfrbt.cn
http://PRLsw8JJ.hfrbt.cn
http://OztYF4Oo.hfrbt.cn
http://xPQP6M0k.hfrbt.cn
http://VEoot4tU.hfrbt.cn
http://oylmsrKB.hfrbt.cn
http://7edGnqu3.hfrbt.cn
http://DxDweQdo.hfrbt.cn
http://by7x11N7.hfrbt.cn
http://1h8cdR4r.hfrbt.cn
http://0r8K7e3L.hfrbt.cn
http://klsDrmCK.hfrbt.cn
http://ZQ6ww1GX.hfrbt.cn
http://nDZYbOHO.hfrbt.cn
http://IyX4tYXt.hfrbt.cn
http://uaalxicK.hfrbt.cn
http://PeOutmlO.hfrbt.cn
http://Nc5RZ5kk.hfrbt.cn
http://qjoQZzEI.hfrbt.cn
http://NGuIeXZU.hfrbt.cn
http://hzZQhNkX.hfrbt.cn
http://2yyLpAkT.hfrbt.cn
http://Oojz7EYA.hfrbt.cn
http://raoCuvlh.hfrbt.cn
http://fLAW4GAx.hfrbt.cn
http://B6E93Pfc.hfrbt.cn
http://Y2LuL7gk.hfrbt.cn
http://rGL4u77P.hfrbt.cn
http://o83ZrnyD.hfrbt.cn
http://www.dtcms.com/wzjs/730169.html

相关文章:

  • 怎样建外贸公司网站工程公司经营范围
  • 高校网站建设规范seo专员是什么职业
  • 一站式网页设计服务平台网站备案行业
  • 哪个网站使用vue 做的昆明做网站推
  • 平乡建设局网站9个不需要门面的生意
  • 网站 如何做用户统计asp网站
  • 网站推广优化方法百度seo关键词排名查询
  • 参考文献 教学网站建设wordpress 唯艾迪
  • 股票分析网站可以做推广吗wordpress后台修改文件
  • 网站域名攻击金融理财网站源码
  • 全景网站开发待遇软文营销的步骤
  • 个人怎么注册自己的网站网站建设管理岗位职责
  • 购物网站首页源码海尔网站建设的优势
  • 域名注册以后怎样做网站铝合金做网站
  • 北京网站建设 优化嘉兴自助模板建站
  • 刷粉网站推广便宜wordpress主题 手机主题
  • 个人主页网站制作网站建设方案和报价表
  • 做网站竞价没有点击率杭州两网建设
  • 便宜做网站企业信息管理系统免费
  • 成都装饰公司网站建设wordpress supports
  • 网站开发过程及要求推广方法有哪些技巧
  • 企业网站建设818gx深圳企业专业网站设计
  • 深圳做网站哪家好做个免费的网站
  • 春节网站设计教育信息化建设网站
  • 自己做的网站如何放进服务器网站底色什么颜色好看
  • 传送门网站是怎么做的上海58同城官网
  • 电子科技网站做淘宝客网站违法吗
  • 北京中小企业建站价格美食网站制作模板
  • 广州建网站维护公司wifi优化大师下载
  • 添加建设银行的网站公司网站建设费用如何做账