当前位置: 首页 > news >正文

一键修复ipynb,Jupyter Notebook损坏文件

背景

最近在写一个数据分析项目时,不幸遇到了 断电导致电脑重启 的突发情况。当我再次打开 Jupyter Notebook 文件(.ipynb)时,发现文件已经损坏,Jupyter 无法正常读取它,甚至有时直接报错:

Unreadable Notebook: NotJSONError: Notebook does not appear to be JSON

当时脑袋一热,以为几小时的工作都白费了。但 .ipynb 文件本质是 一个 JSON 格式的文本文件,所以理论上,我们仍然有机会手动提取出其中的代码部分

于是我写了一个小脚本,成功地把所有代码提取出来保存为 .py 文件,也成功“自救”!

解决思路

Jupyter Notebook 的每个代码单元(Code Cell)结构如下:

{"cell_type": "code","source": ["import numpy as np\n","print(np.arange(10))\n"],...
}

我们可以写个 Python 脚本:

  1. 加载 .ipynb 文件的 JSON 内容

  2. 遍历所有 cell

  3. 提取 "cell_type": "code" 类型的 "source" 内容

  4. 拼接成纯 Python 文件并保存

具体解决方案的代码

import jsondef extract_code_from_ipynb(ipynb_path, output_py_path):with open(ipynb_path, 'r', encoding='utf-8') as f:data = json.load(f)code_lines = []for idx, cell in enumerate(data.get('cells', [])):if cell.get('cell_type') == 'code':code_lines.append(f"# ---- Cell {idx} ----")code = ''.join(cell.get('source', []))  # 是一个 list,需要 joincode_lines.append(code)code_lines.append('\n')  # 添加空行分隔with open(output_py_path, 'w', encoding='utf-8') as f:f.write('\n'.join(code_lines))print(f"提取完成,代码已保存到:{output_py_path}")

假设你的 notebook 文件名为 tushare_usage.ipynb,运行:

extract_code_from_ipynb('tushare_usage.ipynb', 'tushare_usage_recovered.py')

脚本会生成一个新的 Python 文件,包含你所有的代码:

# ---- Cell 0 ----
import tushare as ts
df = ts.get_k_data('000001')
df.head()# ---- Cell 1 ----
print(df.describe())

如果你也不幸遇到了 notebook 文件损坏的情况,不妨试试这个脚本,可能就能帮你挽回几个小时的心血。希望这个小工具能帮到你!

http://www.dtcms.com/a/296169.html

相关文章:

  • redis前期工作:环境搭建-在ubuntu安装redis
  • 基于xxl-job的分片实现分库分表后的扫表
  • Qt WebEngine Widgets的使用
  • MCNN-BiLSTM-Attention分类预测模型等!
  • ChemDraw23软件下载及安装教程|附带软件下载文件|ChemDraw20-23pro版本
  • <<P4116 Qtree3>>
  • 胡良兵Nature Chem Eng:孔隙门控焦耳热精准升级聚乙烯为航油前驱物
  • 中央广播电视总台联合阿里云研究院权威发布《中国人工智能应用发展报告(2025)》:我国依旧需要大力注重人工智能人才的培养
  • Coze工作流-更多图像插件
  • 数据集成难在哪?制造企业该怎么做?
  • Docker多主机网络连接:实现跨主机通信
  • 主流摄像头协议及其开源情况,GB/T 28181协议介绍
  • 配电自动化终端中电源模块的设计
  • uniapp中flex布局gap属性兼容处理
  • PH73211L_VC1/PH73211LQ_VC1:低功耗USB HiFi音频解码器固件技术解析
  • QML WorkerScript
  • 【Spring Boot】热部署终极指南:IDEA高效配置与JRebel替代方案深度解析
  • 第4章唯一ID生成器——4.1 分布式唯一ID
  • Vimba相机二次开发教程,基于Python
  • R 语言科研配色 --- 第 81 期 (附免费下载的配色绘图PPT)
  • 【性能测试】Jmeter+Grafana+InfluxDB+Prometheus Windows安装部署教程
  • 重生学AI第二十集(大结局):完善模型以及学习总结
  • 【STM32】FreeRTOS 任务的删除(三)
  • NX804NX810美光固态闪存NX815NX839
  • 人形机器人双足行走动力学:K-V模型其肌腱特性拟合中的应用
  • Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型通过YoloV8深度学习模型实现工人安全装备(安全帽、手套、马甲等)检测识别 (C#)
  • C++高效实现轨迹规划、自动泊车、RTS游戏、战术迂回包抄、空中轨迹、手术机器人、KD树
  • 408——数据结构(第二章 线性表)
  • IPSec VPN -- 野蛮模式
  • windows11新建文件夹重命名时总是出现加载界面卡死状态