当前位置: 首页 > wzjs >正文

做淘宝必备的网站域名信息查询系统

做淘宝必备的网站,域名信息查询系统,wordpress 七牛设置,哪里可以学到运营XPDF是一个开源的PDF查看、提取和转换工具套件,使用C编写,支持多种操作系统,包括Linux、Unix、OS/2、Windows和Mac OS X‌1。XPDF不仅是一个PDF查看器,还包含多个实用工具,如文本提取器、图像转换器和HTML转换器等‌&a…

      XPDF是一个开源的PDF查看、提取和转换工具套件,使用C++编写,支持多种操作系统,包括Linux、Unix、OS/2、Windows和Mac OS X‌1。XPDF不仅是一个PDF查看器,还包含多个实用工具,如文本提取器、图像转换器和HTML转换器等‌,内置工具包含pdftohtml、pdftotext、pdftopng、pdftops等,支持命令行调用,可实现自主开发程序的自动化。

      下面以pdftotext为例,介绍一下将PDF转换为TXT的用法:

一、命令的规则

pdftotext version 4.05 [www.xpdfreader.com]
Copyright 1996-2024 Glyph & Cog, LLC
Usage: pdftotext [options] <PDF-file> [<text-file>]
  -f <int>               : first page to convert
  -l <int>               : last page to convert
  -layout                : maintain original physical layout
  -simple                : simple one-column page layout
  -simple2               : simple one-column page layout, version 2
  -table                 : similar to -layout, but optimized for tables
  -lineprinter           : use strict fixed-pitch/height layout
  -raw                   : keep strings in content stream order
  -fixed <number>        : assume fixed-pitch (or tabular) text
  -linespacing <number>  : fixed line spacing for LinePrinter mode
  -clip                  : separate clipped text
  -nodiag                : discard diagonal text
  -enc <string>          : output text encoding name
  -eol <string>          : output end-of-line convention (unix, dos, or mac)
  -nopgbrk               : don't insert a page break at the end of each page
  -bom                   : insert a Unicode BOM at the start of the text file
  -marginl <number>      : left page margin
  -marginr <number>      : right page margin
  -margint <number>      : top page margin
  -marginb <number>      : bottom page margin
  -opw <string>          : owner password (for encrypted files)
  -upw <string>          : user password (for encrypted files)
  -verbose               : print per-page status information
  -q                     : don't print any messages or errors
  -cfg <string>          : configuration file to use in place of .xpdfrc
  -listencodings         : list all available output text encodings
  -v                     : print copyright and version info
  -h                     : print usage information
  -help                  : print usage information
  --help                 : print usage information
  -?                     : print usage information

二、参数解释

-layout 选项可以保持原始PDF的布局信息。
-enc UTF-8 指定输出文件的编码为UTF-8。 
-f <num> : 指定要转换的起始页码。
-l <num> : 指定要转换的结束页码。
-enc <encoding> : 指定输出文件的编码格式,常用的有UTF-8等。

三、使用实例

1. 转换PDF为TXT文档。

pdftotxt.exe <input.pdf> [<output.txt>]

其中 <input.pdf> 是源PDF文件的路径, <output.txt> 是输出的文本文件路径(可选)。

2. 如果PDF包含中文,转换时需指定输出文件的编码格式。

pdftotext -enc UTF-8 input.pdf output.txt

3. 如果需要保持原始PDF的布局,可以加上-layout 选项。

pdftotext -layout -enc UTF-8 input.pdf output.txt

4. 指定转换页码的范围。

pdftotxt.exe -layout -enc UTF-8 -f 1 -l 2 input.pdf output.txt

将 input.pdf 的第1页和第2页转换为output.txt。

三、下载地址

PDF转换工具xpdf-tools-win-4.05

PDF转换工具xpdf-tools-linux-4.05

http://www.dtcms.com/wzjs/357444.html

相关文章:

  • 一般网站建设用什么样的代码seo三人行论坛
  • 什么网站做品牌特卖优化网址
  • 毕业设计网站做啥百度端口开户推广
  • 怎么找做网站的外包公司百度人工服务
  • discuz网站建设自助建站免费建站平台
  • 创建购物网站自助建站系统哪个好用
  • 网站搭建修改收费依据深圳网络推广渠道
  • 石家庄专业制作网站郑州网站关键词排名
  • 中国住房和建设委员会网站网站流量排行
  • nginx wordpress安全资源网站优化排名软件公司
  • 苏州建设银行网站搭建一个网站
  • 网页制作视频的网站建设网站seo设置是什么
  • 成都市住房和城乡建设局网站海南seo顾问服务
  • 怎么直接更新wordpress关键词推广seo怎么优化
  • mini主机做网站服务器搜索引擎技巧
  • 济南网站推广服务seo搜索优化费用
  • 网站怎么做站长统计免费b站推广网站2023
  • 潍坊中脉网站建设公司浅谈一下网络营销的几个误区
  • 旅游网站怎么用dw做下载百度2023最新版
  • 比较大气的网站百度关键词seo排名软件
  • .net 企业网站 模版怎么优化自己网站
  • 做那个的网站谁有引擎搜索入口
  • 专门做学校政府的网站百度平台客服联系方式
  • 河北手机网站制作哪家好重庆seo网站运营
  • 金华市有网站建设最低价市场营销公司有哪些
  • 做网站开创和中企动力哪家强域名比价网
  • wordpress 漂浮窗口seo排名赚挂机
  • 网络设计的内容是什么商丘搜索引擎优化
  • 全球网站排名1688自然排名怎么做好
  • 青县做网站代运营靠谱吗