当前位置: 首页 > wzjs >正文

网站建设需要多少工种一站式网络推广服务

网站建设需要多少工种,一站式网络推广服务,长滚动页网站怎么做,做网站需要备案几次我们遇到一些自己喜欢内容,想保存下来,手动复制粘贴很麻烦,我们使用 python 来爬取这些内容。 一、代码 downlod.py import os import requests from bs4 import BeautifulSoup from urllib.parse import urljoin# 目标网页(可…

我们遇到一些自己喜欢内容,想保存下来,手动复制粘贴很麻烦,我们使用 python 来爬取这些内容。

一、代码

downlod.py

import os
import requests
from bs4 import BeautifulSoup
from urllib.parse import urljoin# 目标网页(可以更改)
url = "https://www.baidu.com"# 指定保存的文件夹和 Markdown 文件名
save_folder = "web_md"
os.makedirs(save_folder, exist_ok=True)
md_filename = os.path.join(save_folder, "page.md")
images_folder = os.path.join(save_folder, "images")
os.makedirs(images_folder, exist_ok=True)# 获取网页内容
response = requests.get(url)
response.encoding = response.apparent_encoding
soup = BeautifulSoup(response.text, "html.parser")# 打开 Markdown 文件
with open(md_filename, "w", encoding="utf-8") as md_file:md_file.write(f"# {soup.title.string.strip()}\n\n")for element in soup.body.find_all(["p", "a", "code", "img", "h1", "h2", "h3", "h4", "h5", "h6", "pre"], recursive=True):if element.name == "h1":md_file.write(f"\n# {element.get_text(strip=True)}\n\n")elif element.name == "h2":md_file.write(f"\n## {element.get_text(strip=True)}\n\n")elif element.name == "h3":md_file.write(f"\n### {element.get_text(strip=True)}\n\n")elif element.name == "h4":md_file.write(f"\n#### {element.get_text(strip=True)}\n\n")elif element.name == "p":md_file.write(f"{element.get_text(strip=True)}\n\n")elif element.name == "a":link_text = element.get_text(strip=True)href = urljoin(url, element["href"])md_file.write(f"[{link_text}]({href})\n\n")elif element.name == "code":md_file.write(f"```\n{element.get_text(strip=True)}\n```\n\n")elif element.name == "pre":md_file.write(f"```\n{element.get_text()}\n```\n\n")elif element.name == "img":img_url = urljoin(url, element["src"])img_name = os.path.basename(img_url).split("?")[0]img_path = os.path.join(images_folder, img_name)try:img_data = requests.get(img_url).contentwith open(img_path, "wb") as img_file:img_file.write(img_data)md_file.write(f"![{img_name}](images/{img_name})\n\n")except Exception as e:print(f"下载 {img_url} 失败: {e}")print(f"Markdown 文件已保存至 {md_filename}")

二、安装环境

  1. 安装 python
  2. 管理员运行 cmd,最好挂梯子
pip install requests beautifulsoup4

在这里插入图片描述
3. 在 downlod.py 同级目录下运行cmd

python download.py

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

三、vscode + markdown all in one

  1. 安装 vscode
  2. vscode 的扩展安装 markdown all in one
    在这里插入图片描述
  3. vscode 打开下载的 md 文件
  4. 点击右上角的 预览 按钮,即可预览转换后的 md 文件
    在这里插入图片描述
  5. ctrl + shift + p,打开命令模式
  6. 输入 markdown ,使用这个命令,可以将md转为 html 格式
    在这里插入图片描述
    在这里插入图片描述
http://www.dtcms.com/wzjs/183764.html

相关文章:

  • 网站建设搭建名风seo软件
  • 唐山中企动力做网站大连谷歌seo
  • 乡镇网站建设如何做好网站推广优化
  • 免费建个人手机网站网页设计制作网站模板图片
  • 柯桥做网站哪家好2345网址导航怎么卸载
  • 专业做app下载网站外链吧
  • 帝国cms 做的完整的网站有没有2022年最火的新闻摘抄
  • 宁波网站建设慕枫科技体球网足球世界杯
  • 网页浏览器怎么设置宁波seo哪家好快速推广
  • 服务商是什么意思seo网页优化公司
  • 做网站如何快速推广一款产品百度关键词优化快速排名软件
  • 加盟网站开发费用5月新冠病毒最新消息
  • phpmysql动态网站开发从基础到实践百度官方客户端
  • 做网站找客户seo网络推广课程
  • 新闻网站建设的原因谷歌seo建站
  • 苏州做网站公司有哪些seo全称是什么
  • 深圳网站设计公司怎么找百度下载软件
  • 网站页面设计尺寸地推任务网
  • 网页在线客服系统源码百度搜索关键词排名优化推广
  • 12306的网站是哪个公司做的企业网站建设优化
  • 旅游类网站模板最好最全的搜索引擎
  • 做网站模板广州营销推广
  • 防水网站的外链如何找企业网络营销的模式有哪些
  • 龙华区网站建设网站seo在线优化
  • 建论坛型网站360推广客服电话是多少
  • 贵州省城乡与建设厅网站关键字排名优化工具
  • 中国建筑网官网二测时间微信小程序排名关键词优化
  • 有什么网站可以做logo赚钱网络推广方式有哪几种
  • 网站开发需要什么软件新手怎么做销售
  • 公司网站后台打不开什么是网络营销?