python实战项目75:爬取nature《自然》杂志论文信息
python实战项目75:爬取nature《自然》杂志论文信息
- 一、背景介绍
- 二、寻找数据接口
- 三、发送请求、获取数据
- 四、解析数据、保存数据
- 五、完整代码
一、背景介绍
《自然》(nature,主页:https://www.nature.com/)是世界上历史悠久的、最有名望的科学杂志之一,首版于1869年11月4日。与当今大多数科学论文杂志专一于一个特殊的领域不同,《自然》是少数依然发表来自很多科学领域的一手研究论文的杂志。在许多科学研究领域中,很多最重要、最前沿的研究结果都是以短讯的形式发表在《自然》上。另外,Nature旗下子刊,合作期刊众多,是一个科学研究无法绕过的重要的学习平台。
现在我们需要通过Nature平台获取一些我们关心的论文信息,下面就用python开始吧。
二、寻找数据接口
进入Nature主页,通过高级检索功能,搜索关键词llm,限制年份为“2023-2024”,搜索得到近两年间关键词含有llm的Nature平台相关文章。
打开开发者工具,刷新页面进行抓包,找到数据接口,