当前位置: 首页 > wzjs >正文

什么是理财北京网站建设公司好创建个人主页网站

什么是理财北京网站建设公司好,创建个人主页网站,淘宝客建站工具,旅游网站哪个好我们遇到一些自己喜欢内容,想保存下来,手动复制粘贴很麻烦,我们使用 python 来爬取这些内容。 一、代码 downlod.py import os import requests from bs4 import BeautifulSoup from urllib.parse import urljoin# 目标网页(可…

我们遇到一些自己喜欢内容,想保存下来,手动复制粘贴很麻烦,我们使用 python 来爬取这些内容。

一、代码

downlod.py

import os
import requests
from bs4 import BeautifulSoup
from urllib.parse import urljoin# 目标网页(可以更改)
url = "https://www.baidu.com"# 指定保存的文件夹和 Markdown 文件名
save_folder = "web_md"
os.makedirs(save_folder, exist_ok=True)
md_filename = os.path.join(save_folder, "page.md")
images_folder = os.path.join(save_folder, "images")
os.makedirs(images_folder, exist_ok=True)# 获取网页内容
response = requests.get(url)
response.encoding = response.apparent_encoding
soup = BeautifulSoup(response.text, "html.parser")# 打开 Markdown 文件
with open(md_filename, "w", encoding="utf-8") as md_file:md_file.write(f"# {soup.title.string.strip()}\n\n")for element in soup.body.find_all(["p", "a", "code", "img", "h1", "h2", "h3", "h4", "h5", "h6", "pre"], recursive=True):if element.name == "h1":md_file.write(f"\n# {element.get_text(strip=True)}\n\n")elif element.name == "h2":md_file.write(f"\n## {element.get_text(strip=True)}\n\n")elif element.name == "h3":md_file.write(f"\n### {element.get_text(strip=True)}\n\n")elif element.name == "h4":md_file.write(f"\n#### {element.get_text(strip=True)}\n\n")elif element.name == "p":md_file.write(f"{element.get_text(strip=True)}\n\n")elif element.name == "a":link_text = element.get_text(strip=True)href = urljoin(url, element["href"])md_file.write(f"[{link_text}]({href})\n\n")elif element.name == "code":md_file.write(f"```\n{element.get_text(strip=True)}\n```\n\n")elif element.name == "pre":md_file.write(f"```\n{element.get_text()}\n```\n\n")elif element.name == "img":img_url = urljoin(url, element["src"])img_name = os.path.basename(img_url).split("?")[0]img_path = os.path.join(images_folder, img_name)try:img_data = requests.get(img_url).contentwith open(img_path, "wb") as img_file:img_file.write(img_data)md_file.write(f"![{img_name}](images/{img_name})\n\n")except Exception as e:print(f"下载 {img_url} 失败: {e}")print(f"Markdown 文件已保存至 {md_filename}")

二、安装环境

  1. 安装 python
  2. 管理员运行 cmd,最好挂梯子
pip install requests beautifulsoup4

在这里插入图片描述
3. 在 downlod.py 同级目录下运行cmd

python download.py

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

三、vscode + markdown all in one

  1. 安装 vscode
  2. vscode 的扩展安装 markdown all in one
    在这里插入图片描述
  3. vscode 打开下载的 md 文件
  4. 点击右上角的 预览 按钮,即可预览转换后的 md 文件
    在这里插入图片描述
  5. ctrl + shift + p,打开命令模式
  6. 输入 markdown ,使用这个命令,可以将md转为 html 格式
    在这里插入图片描述
    在这里插入图片描述
http://www.dtcms.com/wzjs/796565.html

相关文章:

  • 有做电动车修车的网站吗深圳网站托管公司
  • 做网站框架广告设计师证怎么考
  • 越秀区做网站wordpress radiate
  • 高安网站找工作做面点事宁波建网站报价
  • 网站建设com网站百度推广最简单方法
  • 网站从哪几个方面维护杭州滨江网站建设
  • 福州品牌网站设计购买已备案网站做非法
  • 做阿里巴巴还是做网站好wordpress登录 小工具
  • 南充市建设局官方网站中国建设银行网站无法访问
  • 杭州网站设计推荐柚米百度关键词推广多少钱
  • 免费自己做网站手机软件wordpress仿亿欧网
  • 服务器不稳定 如何让百度重新收录网站谷歌amp wordpress
  • 中国建设银行上海市分行网站wordpress图片七牛云加速
  • 网站 当前时间 代码承德公司网站建设
  • 怎么做微课网站注册公司流程和费用注册资金
  • 长春网站建设优势吉网传媒好jsp做网站de后台管理
  • 盐城亭湖区建设局网站郑州市建设局官网
  • 陕西住房与建设厅网站网站备案 代理
  • 网站建设研究方法wordpress小程序美化
  • 做个公司网站网页编辑文字
  • 网站开发 技术方案邢台网站建设网络公司
  • 重庆自助建站网站wordpress怎装模板
  • 北京做网站建设有发展吗重庆网站建设招标
  • 杭州企业网站开发wordpress登陆页面保护插件
  • 网站建设广告模板wordpress如何播放视频播放
  • 网站开发技术协议银川森林半岛
  • 怎么查网站关键词排名石家庄便宜网站制作
  • 电商平台网站技术开发flash网站需要改变
  • 网站建设改版攻略app设计网站推荐
  • 安卓网站开发ui宁夏住房城乡建设厅网站