当前位置: 首页 > wzjs >正文

做网站需要注意事项如何创建个人网页

做网站需要注意事项,如何创建个人网页,wordpress图片显示在文章,山东省建设厅网站一体化平台前言 不是很懂爬虫,所以就叫deepseek写了一个 用起来很简单,但是有一个小问题,就是统计的是总字符数。代码片会被统计进去,Markdown语法也会被统计进去。 不过我没有太多需求,能大概统计一下满足以下小小的好奇心和成…

前言

不是很懂爬虫,所以就叫deepseek写了一个


用起来很简单,但是有一个小问题,就是统计的是总字符数。代码片会被统计进去,Markdown语法也会被统计进去。


不过我没有太多需求,能大概统计一下满足以下小小的好奇心和成就感就行。如果有额外需求可以叫deepseek再改

代码

import requests
from bs4 import BeautifulSoup
import time
import random# 替换为你的CSDN博客主页URL
base_url = "https://blog.csdn.net/用户id/article/list/"# 设置请求头,模拟浏览器访问
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36"
}# 获取博客文章列表
def get_article_links(base_url, headers):article_links = []page = 1while True:url = f"{base_url}{page}"response = requests.get(url, headers=headers)soup = BeautifulSoup(response.text, 'html.parser')# 查找所有文章的链接articles = soup.find_all('div', class_='article-item-box')if not articles:break  # 如果没有文章了,退出循环for article in articles:link = article.find('h4').find('a')['href']article_links.append(link)page += 1time.sleep(random.uniform(1, 3))  # 随机延迟,避免触发反爬虫return article_links# 统计文章字数
def count_words(article_links, headers):total_words = 0cnt = 0for link in article_links:try:# 随机延迟,避免触发反爬虫time.sleep(random.uniform(1, 3))# 获取文章内容article_response = requests.get(link, headers=headers)article_soup = BeautifulSoup(article_response.text, 'html.parser')# 查找文章正文部分(根据CSDN的HTML结构)content = article_soup.find('div', class_='markdown_views') or article_soup.find('article', class_='baidu_pl')if content:text = content.get_text(strip=True)  # 提取纯文本word_count = len(text)  # 统计字数(按字符数计算)total_words += word_countcnt += 1print(f"文章链接: {link}, 字数: {word_count} , 序号 : {cnt}")else:print(f"文章链接: {link}, 未找到正文内容")except Exception as e:print(f"文章链接: {link}, 抓取失败: {e}")return total_words# 获取所有文章的链接
article_links = get_article_links(base_url, headers)# 统计总字数
total_words = count_words(article_links, headers)
print(f"总字数: {total_words}")

用法

只需要把base_url = "https://blog.csdn.net/用户id/article/list/"这里的用户id替换成你的用户id就可以了


用户id在个人资料里查看

http://www.dtcms.com/wzjs/46629.html

相关文章:

  • 蚌埠网站制作公司费用360推广官网
  • 广州市制网公司seo推广教学
  • 利用excel做填报网站聊城seo整站优化报价
  • 三层网络架构长沙seo推广公司
  • 音乐分享 wordpress西安官网seo技术
  • 做的比较好的二手交易网站有哪些sem推广竞价托管公司
  • 代理服务器地址是什么意思惠州seo优化服务
  • 广州网站建设建航特大新闻凌晨刚刚发生
  • php装饰公司网站源码网站seo如何优化
  • 微信上的网站怎么做网站如何快速收录
  • 宁波企业网站制作推荐seo 页面
  • 阿里云wordpress更新谷歌优化工具
  • 天地做网站站内营销推广途径
  • 装修怎么做网站自己做网站设计制作
  • photoshop做网站设计营销策略从哪几个方面分析
  • 万网虚拟云空间怎么建设网站seo经理招聘
  • 怎样在网站上做销售微博推广价格表
  • 织梦dedecms医院类网站在线预约挂号插件_utf8seo最新技巧
  • 网站开发有哪些公司301313龙虎榜
  • 福州朝阳房产网站建设本周国内新闻
  • 武汉做网站珠海百度seo
  • PR做视频需要放网站上天津seo排名公司
  • 新光途网站建设网络媒体
  • 永久网站域名注册长沙搜索排名优化公司
  • 有了源码怎么做网站seo技巧优化
  • 深圳建设网站费用明细百度提问登陆入口
  • 营销策略是什么常用seo站长工具
  • 做网站的目的和要求营销推广平台
  • 网站类型大全山东今日热搜
  • 龙岩网站建设品牌运营总监