当前位置: 首页 > news >正文

如何快速给PDF加书签--保姆级教程

买的电子书没有目录书签看着不舒服,手动加书签加到想吐。想有没有办法快速加书签。这要分为PDF目录部分可以被复制和不可被复制两种情况。不可复制时,要用到工具把目录提取出来,变成文字。
工具:Foxit Phantom福昕阅读器(下载链接:Foxit Phantom福昕阅读器官网)、excel、在线文字转换网址。

文字可复制

观察书签的格式,想办法变成我们需要的样子

先添加两个书签,然后导出,保存在一个你能找到的地方。
打开这个书签,观察它。可以发现,它的NAME和PAGE表示的是PDF的位置和书签的名字,我们要做的就是,把这部分内容替换成我们自己的内容思考完发现,只要我们得到这两列数据,就可以
在这里插入图片描述

想办法得到“目录”和“页码”两列数据

替换的宗旨就是,把目录和页码分成两列

  1. 直接复制目录到一个文本文件中

  2. 全局替换页码前的“……”为“#”(其他符号也行,但是是点号、顿号和/经常出现在目录文字描述中,不要用)

  3. 文字复制到excel中

  4. 替换技巧:先替换“…”,然后替换“#.”为“#”,要不然会把1.2.1中的“.”替换掉。最后把“##”替换为“#”。

  5. 看一遍文本,确认是目录后是#和页码,才算干净
    在这里插入图片描述

  6. 把处理好的文本文件粘贴到excel中,然后以“#”分列,标题和页码就分成了两列。

  7. 这里的页码是书的页码,还要都加上一个数字11(前面有几页,可以根据你导出的page值和实际值对应)变成PDF的页码
    在这里插入图片描述

  8. 然后利用excel的函数功能&把单元格中的内容拼装成书签需要的格式。公式为“=A1&A3&A5”
    在这里插入图片描述

把目录按照一定的格式放进书签的xml中

在这里插入图片描述

  1. 最后一行的“”先粘贴出来放个位置
  2. 用下拉的方式,复制出很多的行的格式(目录有几个行就拉几个行)
  3. 再把“”粘贴到最后一行去
  4. 数据–分列–“按照空格分列”,然后就把NAME和PAGE分离出来了。
    书签图

接下来把我们需要的NAME和PAGE填进去

  1. 步骤5中准备好的NAME和PAGE,覆盖书签图中的B和C列,注意以“123”只粘贴值的方式粘贴
    在这里插入图片描述
  2. 然后把excel中的内容粘贴回书签的xml中
  3. 打开书的书签,“导入书签”
  4. 分级的话,自己动手分级也挺方便
    在这里插入图片描述

文字不可复制

用图片转文字功能,将文字提取出来,得到想要的格式。有一下几种途径:

  1. deepseek图片转文字(缺点:没页码,要自己加)
  2. https://ocr.wdku.net/,有点儿慢,但是可以在线使用
  3. 豆包等AI工具(缺点:要登录)
http://www.dtcms.com/a/310361.html

相关文章:

  • TCP协议的特点和首部格式
  • 电力系统与变压器实验知识全总结 | 有功无功、同步发电机、短路空载实验、电压调整率、效率条件全讲透!
  • curl命令使用
  • 蒙特卡罗方法(Monte Carlo Method)_学习笔记
  • 【面板数据】全国31省名义、实际GDP及GDP平减指数数据(2000-2024年)
  • VR拍摄的流程与商业应用,实用的VR拍摄技巧
  • 汇川ITS7100E触摸屏交互界面开发(二)界面开发软件使用记录
  • python试卷01
  • Cesium性能优化
  • 代码随想录刷题Day22
  • 如何利用API接口与网页爬虫协同进行电商平台商品数据采集?
  • Java应用服务器选型指南:WebLogic vs. Tomcat、WebSphere、JBoss/Wildfly
  • 今日行情明日机会——20250801
  • Linux系统磁盘未分配的空间释放并分配给 / 根目录的详细操作【openEuler系统】
  • 电脑的时间同步电池坏掉了,每次开机都要调整时间
  • 【RocketMQ】鉴权机制
  • 网络协议之路由是怎么回事?
  • 电商项目_性能优化_数据同步
  • 18.若依框架中的xss过滤器
  • Java 24 新特性解析与代码示例
  • 牛客——取数游戏2
  • UE5 动态扫描波
  • 【C#学习Day15笔记】拆箱装箱、 Equals与== 、文件读取IO
  • iPhone查看App日志和系统崩溃日志的完整实用指南
  • 深入理解C语言指针:从回调函数到数组指针笔试题全解析(下)
  • 遥控器信号捕获
  • [CISCN 2022 初赛]online_crt
  • 基于react的YAPI实战指南
  • JavaWeb--Student2025项目:增删改查
  • 光纤网络FTTx(光接入网的应用类型)