从PDF中提取文本和图像的初学者指南

学习多种方法从PDF文件中提取图像和文本

PDF文件非常适合跨平台交换格式化文件,也适用于不使用相同软件的人群,但有时我们需要从PDF文件中提取文本或图像,并将其用于网页, 文字处理文档 ,PowerPoint演示文稿或在桌面出版软件中

根据您的需求和个人PDF中设置的安全选项,您可以通过多种方式从PDF文件中提取文本,图像或两者。 选择最适合您的选项。

使用Adobe Acrobat从PDF文件中提取图像和文本

如果您拥有Adobe Acrobat的完整版本,而不是免费的Acrobat Reader,则可以从PDF中提取单个图像或所有图像以及文本,并以各种格式(如EPS,JPG和TIFF)导出。 要从Acrobat DC中的PDF中提取信息,请选择“ 工具” >“ 导出PDF”并选择一个选项。 要提取文本,请将PDF导出为Word格式或富文本格式,并从以下几个选项中进行选择:

使用Acrobat Reader从PDF复制和粘贴

如果您拥有Acrobat Reader,则可以将一部分PDF文件复制到剪贴板并将其粘贴到另一个程序中。 对于文本,只需突出显示PDF中的文本部分,然后按Control + C进行复制即可。

然后打开文字处理程序,例如Microsoft Word ,然后按Control + V粘贴文本。 使用图像时,单击图像将其选中,然后使用相同的键盘命令将其复制并粘贴到支持图像的程序中。

在图形程序中打开PDF文件

当图像提取是您的目标时,您可以在一些插图程序中打开PDF ,例如较新版本的Photoshop ,CorelDRAW或Adobe Illustrator,并保存图像以供在桌面出版应用程序中编辑和使用。

使用第三方PDF提取软件工具

有几个独立的实用程序和插件可用于将PDF文件转换为HTML,同时保留页面布局,将PDF内容提取并转换为矢量图形格式,并提取PDF内容以用于文字处理,演示文稿和桌面出版软件。 这些工具提供了多种选项,包括批量提取/转换,整个文件或部分内容提取,以及多种文件格式支持。这些工具主要是商业和共享软件基于Windows的实用程序。

使用在线PDF提取工具

使用在线提取工具,您不必下载或安装软件。 每个人可以提取的数量各不相同。 例如,通过ExtractPDF.com,您可以上传大小不超过14MB的文件,或者提供PDF的URL以提取图像,文本或字体。

截图

在使用PDF格式截取图像之前,请尽可能在屏幕上将其放大。 在PC上,单击PDF窗口的标题栏并按Alt + PrtScn 。 在Mac上,单击Command + Shift + 4并使用出现的光标拖动并选择要捕获的区域。