当前位置: 首页 > wzjs >正文

淘宝做动图网站网站seo检测工具

淘宝做动图网站,网站seo检测工具,怎么修改网站标题,wordpress 男科医院主题业务场景: AI生成的html文件,通常会使用多个cdn资源、手动替换or下载太过麻烦、如下py程序为此而生,指定html目录自动下载并替换~ import os import requests from bs4 import BeautifulSoup from urllib.parse import urlparse import has…

业务场景:
AI生成的html文件,通常会使用多个cdn资源、手动替换or下载太过麻烦、如下py程序为此而生,指定html目录自动下载并替换~
在这里插入图片描述

import os
import requests
from bs4 import BeautifulSoup
from urllib.parse import urlparse
import hashlibclass CDNDownloader:def __init__(self, html_dir, static_dir='static'):self.html_dir = os.path.abspath(html_dir)self.static_dir = os.path.join(self.html_dir, static_dir)os.makedirs(self.static_dir, exist_ok=True)def process_all_html_files(self):"""处理指定目录下的所有HTML文件"""for root, _, files in os.walk(self.html_dir):for file in files:if file.endswith(('.html', '.htm')):file_path = os.path.join(root, file)print(f"Processing {file_path}...")self.process_single_html(file_path)def process_single_html(self, html_path):"""处理单个HTML文件"""with open(html_path, 'r', encoding='utf-8') as f:content = f.read()soup = BeautifulSoup(content, 'html.parser')# 计算HTML文件相对于根目录的层级rel_path = os.path.relpath(os.path.dirname(html_path), self.html_dir)path_prefix = '../' * len(rel_path.split(os.sep)) if rel_path != '.' else ''# 处理CSS文件for link in soup.find_all('link', rel='stylesheet'):if 'href' in link.attrs:old_url = link['href']if self._is_cdn_url(old_url):new_url = self.download_resource(old_url, 'css')# 根据HTML文件的位置调整相对路径link['href'] = f"{path_prefix}{new_url}"# 处理JS文件for script in soup.find_all('script', src=True):old_url = script['src']if self._is_cdn_url(old_url):new_url = self.download_resource(old_url, 'js')# 根据HTML文件的位置调整相对路径script['src'] = f"{path_prefix}{new_url}"# 保存修改后的HTML文件with open(html_path, 'w', encoding='utf-8') as f:f.write(str(soup))def _is_cdn_url(self, url):"""判断是否为CDN URL"""return url.startswith(('http://', 'https://', '//'))def download_resource(self, url, resource_type):"""下载资源并返回本地路径"""if url.startswith('//'):url = 'https:' + urltry:response = requests.get(url, timeout=10)if response.status_code == 200:# 使用URL的最后部分作为文件名,如果没有扩展名则添加filename = os.path.basename(urlparse(url).path)if not filename:# 如果URL没有文件名,使用URL的MD5作为文件名filename = hashlib.md5(url.encode()).hexdigest()filename = f"{filename}.{resource_type}"# 确保文件有正确的扩展名if not filename.endswith(f'.{resource_type}'):filename = f"{filename}.{resource_type}"# 创建资源类型子目录resource_dir = os.path.join(self.static_dir, resource_type)os.makedirs(resource_dir, exist_ok=True)file_path = os.path.join(resource_dir, filename)with open(file_path, 'wb') as f:f.write(response.content)# 返回相对于static目录的路径return os.path.join('static', resource_type, filename).replace('\\', '/')except Exception as e:print(f"Error downloading {url}: {str(e)}")return urlreturn urldef process_directory(html_dir, static_dir='static'):"""直接处理指定目录的便捷函数"""downloader = CDNDownloader(html_dir, static_dir)downloader.process_all_html_files()def main():# 方式1:命令行参数try:import argparseparser = argparse.ArgumentParser(description='Download CDN resources from HTML files')parser.add_argument('html_dir', help='Directory containing HTML files')parser.add_argument('--static-dir', default='static', help='Directory to save downloaded resources')args = parser.parse_args()process_directory(args.html_dir, args.static_dir)except SystemExit:# 方式2:写死在代码中的路径html_directories = ["templates",  # 示例路径1]for directory in html_directories:print(f"\n处理目录: {directory}")process_directory(directory)print("Done! All CDN resources have been downloaded and HTML files updated.")if __name__ == '__main__':main() 
http://www.dtcms.com/wzjs/314011.html

相关文章:

  • python java 网站开发百度云网盘官网
  • sem与seo的区别企业seo优化服务
  • 网站页面设计说明怎样注册网站建立网页
  • 营销型集团网站建设seo排名怎么做
  • 推荐一个看b的微信公众号简述搜索引擎优化的方法
  • 天津城市网络建设优化关键词排名外包
  • 政府网站建设的项目描述优化百度涨
  • 群晖wordpress如何连接mysql寰宇seo
  • 网站建设的方式有哪些方面高端网站建设制作
  • 深圳网站建设怎么选择兔子bt搜索
  • 做网站怎么移动图片抖音推广合作方式
  • 外贸网站 海外推广亚马逊关键词
  • 99建筑网99建设工程教育网石家庄seo关键词
  • 老薛主机做两个网站网络公司网站模板
  • 美妆网站怎么做网站推广营销的步骤
  • 宝安网站建设信科免费bt蚂蚁磁力搜索天堂
  • 济南网站建设技术支持百度推广官网网站
  • 动态网站可以用dw做吗网络服务器配置与管理
  • java做的网站放哪里怎么关闭seo综合查询
  • vb net 做网站seo优化设计
  • 一个新网站怎么做seo介绍产品的营销推文
  • 芜湖效能建设网站如何提高网站的搜索排名
  • php网站开发工具百度新闻网站
  • 7天精通网站建设实录营销宣传方式有哪些
  • 手机建立网站的软件seo怎么快速提高排名
  • 网站无法显示网页内容网店营销与推广策划方案
  • 少儿图书销售网站开发背景网络营销的缺点及建议
  • 怎样会展网站建设合肥网站制作公司
  • 美人主意的暴利行业长沙竞价优化
  • 网站做锚点好搜网