当前位置: 首页 > news >正文

MATLAB | 如何使用MATLAB获取《Nature》全部绘图 (附23-25年图像)

文末有全部图片资源

我在两年前更过如何用 MATLAB 爬取 《Nature》全部插图,最近又有人问我有没有下载好的24,25年插图的压缩包,于是又去拿代码运行了一下,发现两年前写的代码今天居然还能用,代码如下:

function getNaturePNGWhileTure(YEAR)
if nargin < 1YEAR = 2024;
endpbegin = 1; ibegin = 1; jbegin = 1; 
forderName=['Year_',num2str(YEAR)];
if exist(['.\image_',forderName,'\pijbreak.mat'],'file')load(['.\image_',forderName,'\pijbreak.mat']);
end
if ~exist(['.\image_',forderName],'dir')mkdir(['.\image_',forderName]);
end
disp([pbegin,ibegin,jbegin])url_full = 'https://www.nature.com/nature/research-articles?searchType=journalSearch&sort=PubDate&year=<Y/>&page=<P/>';
url_year = strrep(url_full,'<Y/>',num2str(YEAR));options=weboptions('Timeout',inf);
html_year  = webread(strrep(url_year,'<P/>','1'),options);fprintf('1->')
A_page_num = strfind(html_year,'u-visually-hidden'); 
Z_page_num = strfind(html_year,'data-page="next"');
page_num   = html_year(A_page_num(find(A_page_num<Z_page_num,1,'last')):Z_page_num);
page_num   = page_num(32:36);
page_num   = str2double(page_num(abs(page_num)<=57&abs(page_num)>=48));for p = pbegin:page_numurl_page  = strrep(url_year,'<P/>',num2str(p));html_page = webread(url_page,options);fprintf('2\n')A_html_artical = strfind(html_page,'itemprop="name headline"');Z_html_artical = strfind(html_page,'data-track-action="view article"');for i = ibegin:length(Z_html_artical)html_artical = html_page(A_html_artical(find(A_html_artical<Z_html_artical(i),1,'last')):Z_html_artical(i));A_artical    = strfind(html_artical,'<a href=');Z_artical    = strfind(html_artical,'class="c-card__link u-link-inherit"');html_artical = html_artical(A_artical(1)+10:Z_artical);html_artical = html_artical(1:find(html_artical=='"')-1);for j = jbegin:50pbegin = p; ibegin = i ; jbegin = j;save(['.\image_',forderName,'\pijbreak.mat'],'pbegin','ibegin','jbegin')html_png=webread(['https://www.nature.com/',html_artical,'/figures/',num2str(j)]);A_png = strfind(html_png,'aria-describedby');Z_png = strfind(html_png,'alt="Fig.');if isempty(Z_png)break;elseurl_png  = html_png(A_png:Z_png(find(Z_png>A_png,1)));url_png  = ['https:',url_png(strfind(url_png,'src="')+5:end-3)];url_png  = strrep(url_png,'lw685','full');name_png = ['.\image_',forderName,'\',html_artical(10:end),' Fig-',num2str(j)];websave(name_png,url_png,options);disp(['Downloading Year-',num2str(YEAR),...' Page-',num2str(p),' Artical-',num2str(i),...' Fig-',num2str(j),':',html_artical])endendjbegin = 1;endibegin = 1;
end
end

使用方法很简单,例如下载2024年图片,就命令行窗口运行getNaturePNGWhileTure(2024)

代码做了断点设置,可以下载到一半暂停有空继续下,保存的文件名称即为论文编号,例如我想看看下面这张有意思图片的原文:

可以看到文章编号为s41586-023-06728-8,我们只需要搜索:

  • https://www.nature.com/articles/s41586-023-06728-8

下面展示一下比较有趣或者好看新颖的图片,然后会在文章最后给出这仨年全部图片的资源,大概一万多张图片。

部分图像展示

2023


2024

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传


2025

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传


资源链接

2023 (共计5068张)

  • https://pan.baidu.com/s/1iEMBewOyPbJNejhkxLhISg?pwd=slan

2024 (共计5550张)

  • https://pan.baidu.com/s/1Fk5J9TY_6ZaVqqF-flDcLQ?pwd=slan

2025 (共计2930张)

  • https://pan.baidu.com/s/1ji-uuc5dx-bpg43RykY_aQ?pwd=slan

相关文章:

  • 认识LinkedHashMap
  • MySQL 8.0 OCP 英文题库解析(十八)
  • 【android bluetooth 框架分析 04】【bt-framework 层详解 7】【AdapterProperties介绍】
  • 吃透 Golang 基础:函数
  • Markdown入门与语法汇总
  • 用电子垃圾DIY一个可调小电源(5-12V)
  • 【HarmonyOS Next之旅】DevEco Studio使用指南(三十三) -> 构建任务
  • linux学习慕课版 第一章 Linux 文件与目录学习笔记
  • WEBSOCKET研究
  • 深入剖析Redis高性能的原因,IO多路复用模型,Redis数据迁移,分布式锁实现
  • 【IEEE/EI/Scopus检索】2025年第六届模式识别与数据挖掘国际会议 (PRDM 2025)
  • ros导航原理
  • 如何在 Visual Studio Code 中配置SSH、Git 和 Copilot插件
  • 对象注入 BeanFactory 的操作 BeanFactoryPostProcessor , Spring boot
  • 20250613在Ubuntu20.04.6下编译Rockchip的RK3576原厂Android14的SDK【整理编译】
  • JVM GC 问题排查实战案例
  • CSS flex-basis 属性详解:功能、用法与最佳实践
  • EFK架构的数据安全性
  • 前端性能优化:打造极致用户体验
  • 玩转Docker | 使用Docker部署vaultwarden密码管理器
  • 后端网站开发培训/谈谈对seo的理解
  • 做网站是什么职位/公众号seo排名
  • 商城小程序方案/seo网站推广主要目的不包括
  • wordpress发邮件收到不到邮件/郑州seo技术
  • 申请网站怎么申请/微信管理工具
  • 百度推广和哪些网站有合作/怎么做网站广告