当前位置: 首页 > news >正文

cs*n 网页内容转为html 加入 onenote

csdn上有好用的内容,我们怎么将它们加到 onenote 里吃灰呢。

一、创建 新html

create_html.py

import sys

def create_html_file(filename):
    # 检查是否提供了文件名
    if not filename:
        print("请提供HTML文件名")
        return
    
    # 创建HTML内容
    html_content = f"""<!DOCTYPE html>
<html lang="zh-CN">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>{filename}</title>
</head>
<body>
</body>
</html>
"""

    # 写入文件
    with open(filename, 'w', encoding='utf-8') as file:
        file.write(html_content)
    
    print(f"文件 {filename} 已创建")

if __name__ == "__main__":
    if len(sys.argv) != 2:
        print("用法: python create_html.py <html文件名>")
    else:
        create_html_file(sys.argv[1])

使用命令 创建html
在这里插入图片描述

二、网页找内容

在这里插入图片描述
content_views 里就是真正内容了。
copy-> copy outerhtml
粘贴到 创建的html 的 body 中。

三、替换内容

modify_html.py

import sys
import os
from bs4 import BeautifulSoup

def modify_html_file(filename):
    # 检查是否提供了文件名
    if not filename:
        print("请提供HTML文件名")
        return
    
    # 查找当前目录下的HTML文件
    if not os.path.exists(filename):
        print(f"文件 {filename} 不存在")
        return
    
    # 读取HTML内容
    with open(filename, 'r', encoding='utf-8') as file:
        html_content = file.read()
    
    # 使用BeautifulSoup解析HTML
    soup = BeautifulSoup(html_content, 'html.parser')
    
    # 替换指定的div
    divs_to_remove = soup.find_all('div', class_='hljs-button {2}')
    for div in divs_to_remove:
        new_tag = soup.new_tag('p')  # 创建一个新的标签
        new_tag.string = "----------------------------------------------------------------------------------------------------------------"
        div.replace_with(new_tag)  # 替换原标签
    
    # 替换指定的div
    divs_to_remove = soup.find_all('div', class_='hide-preCode-box')
    for div in divs_to_remove:
        # 在原位置添加“------------------”
        new_tag = soup.new_tag('p')  # 创建一个新的标签
        new_tag.string = "----------------------------------------------------------------------------------------------------------------"
        div.replace_with(new_tag)  # 替换原标签
        
    # 删除指定的ul
    uls_to_remove = soup.find_all('ul', class_='pre-numbering')
    for ul in uls_to_remove:
        ul.decompose()
    
    # 写回修改后的HTML内容
    with open(filename, 'w', encoding='utf-8') as file:
        file.write(str(soup))
    
    print(f"文件 {filename} 已修改")

if __name__ == "__main__":
    if len(sys.argv) != 2:
        print("用法: python modify_html.py <html文件名>")
    else:
        modify_html_file(sys.argv[1])

因为拷贝的 html 有以下内容
在这里插入图片描述
太不美观了,要把它们删除掉

在这里插入图片描述
再打开就好看多了
在这里插入图片描述
现在 html 的内容也可以直接复制到 onenote 里吃灰了

相关文章:

  • 整合Salesmart/WhatsApp、开源Odoo模块和Deepseek AI能力,实现针对国外客户的智能客服和个性化推荐服务
  • 计算机网络抄手 运输层
  • 【Javascript Day19】BOM
  • Springboot + Ollama + IDEA + DeepSeek 搭建本地deepseek简单调用示例
  • deepseek-r1系列模型部署分别需要的最低硬件配置
  • 4.7 模型训练基类Trainer:Hugging Face工业级训练引擎深度剖析
  • windows事件倒计时器与提醒组件
  • 4.6 模型训练基类Trainer:Hugging Face工业级训练引擎深度剖析
  • java数据结构_优先级队列(堆)_6.1
  • 挖掘图片的秘密:如何用piexif提取和修改Exif数据
  • 当我问Deepseek:国产8K摄像机有哪些?
  • WebSocket(WS)协议系列(二)事件机制
  • 防泄密软件可以管理电脑的使用,还能防止数据泄漏... 原创
  • 使用Catcho阻止app闪退
  • Docker 在微服务架构中的应用(一)
  • HTML5 面试题
  • 程序员学英文之At the Hotel
  • Redis存储⑨Redis的持久化_RDB和AOF
  • 二、《重学设计模式》-UML类图
  • 在虚拟机中搭建Spark学习环境的完整指南
  • 5吨煤炭“瞬间蒸发”?掺水炭致企业损失千万,腐败窝案曝光
  • “异常”只停留在医院里,用艺术为“泡泡宝贝”加油
  • 微软宣布将裁员3%
  • 上海首发经济“卷”到会展业,浦东签约三个年度“首展”
  • 俄土外长通话讨论俄乌谈判问题
  • 山东枣庄同一站点两名饿了么骑手先后猝死,当地热线:职能部门正调查