当前位置: 首页 > news >正文

利用Git和wget批量下载网页数据

一、Git的下载(参考文章)
二. wget下载(网上很多链接)
三、git和wget结合使用
1.先建立一个文本,将代码写入文本(代码如下),将txt后缀改为sh(download_ssebop.sh)。将wget和.sh文件放在一个文件中(F:\PhD\Mult_year_ET\Ssebop)。然后在Ssebop中右击,点击open Git bash here.然后输入:./download_ssebop.sh。点击回车即可。我需要下载的数据网页链接为:https://edcintl.cr.usgs.gov/downloads/sciweb1/shared/fews/web/global/monthly/etav5/downloads/
在这里插入图片描述
在这里插入图片描述

#!/bin/bash

# 设置基本参数
base_url="https://edcintl.cr.usgs.gov/downloads/sciweb1/shared/fews/web/global/monthly/etav5/downloads/"
start_year=2003
end_year=2021
download_dir="./down"

# 创建下载目录(如果不存在)
mkdir -p "$download_dir"

# 遍历每一年和月,构建URL并调用wget进行下载到指定目录
for year in $(seq $start_year $end_year); do
    for month in $(seq -w 1 12); do # 使用-w选项确保月份是两位数
        filename="m${year}${month}.zip"
        url="${base_url}${filename}"
        echo "Downloading ${filename} from ${url}"

        # 使用wget下载文件到指定目录
        if F:/PhD/Mult_year_ET/Ssebop/wget --quiet --show-progress --progress=bar:force -P "$download_dir" "$url"; then
            echo "Successfully downloaded ${filename} into ${download_dir}."
        else
            echo "Failed to download ${filename}."
        fi
    done
done

以上就可以对网页数据进行批量下载!

长路漫漫…
唯有坚持…

相关文章:

  • 【LangChain】对话历史管理
  • Celia智能助手2.0架构演进与性能突破
  • 网络安全中分区分域
  • 18.1 大模型时代的开源与数据协议:合规之路与技术突
  • 【网络安全】SSL重协商原理、过程、防范详解(含案例)
  • 如何将ConfigMap中的内容挂载为容器内的文件
  • 计算机视觉算法实战——医学影像分割(主页有源码)
  • 大模型笔记_大模型不是靠记忆回答问题
  • C++20 标准化有符号整数:迈向更可预测的整数运算
  • 《深度学习进阶》第9集:自监督学习与无监督学习
  • ES检索elasticsearch实现python库方法
  • 基于微信小程序的停车场管理系统的设计与实现
  • 【论文带读(3)】《Real-Time Flying Object Detection with YOLOv8》带读笔记翻译
  • R语言 | 在图形上标注P值的R包
  • QTcpSocket使用指南与实践
  • 30秒从零搭建机器人管理系统(Trae)
  • flutter集成华为推送(Android)
  • uploadlabs经验总结
  • 将 SSH 密钥添加到 macOS 的钥匙串中
  • 拉格朗日对偶性(Lagrangian Duality)详解
  • 哪个网站做加盟的比较靠谱/企业网站推广方法实验报告
  • 推荐家居网站建设/培训机构招生7个方法
  • 做书封面的网站/网址导航大全
  • 企业网站建设需要哪些软件/网页搜索引擎
  • 石家庄网站建设联系电话/上海优化网站seo公司
  • 做网站阿里巴巴好还是百度好/推广app平台有哪些