将纸质文档扫描为PDF,然后使用Acrobat将其转换为包含可选文本的智能、可搜索PDF文件。
准备事项
在Windows中,您可以使用“自动检测颜色模式”,让Acrobat确定纸质文档的内容类型,或者根据您的判断使用其它预设(“黑白文档”、“灰度文档”、“彩色图像”和“彩色文档”)。您可以配置扫描预设,或使用“自定义扫描”选项通过选择的设置进行扫描。
只有支持“隐藏扫描仪的本机界面”模式的扫描仪驱动程序才能使用预设扫描。扫描预设在MacOS上不可用。
在Windows中,如果您的扫描仪安装了WIA驱动程序,则可以使用扫描按钮创建PDF。按扫描按钮,然后在Windows中,从已注册的应用程序列表中选择AdobeAcrobat。接着,在Acrobat扫描界面中,选择扫描仪及文档预设或自定义扫描。
在Windows上,将显示以下内容:
如果要将多个文件扫描为一个PDF,请选择设置图标。此时会显示“自定义扫描”界面。选择提示扫描更多页面。
选择扫描仪后,您可以根据需要选择或调整其各种扫描选项。
扫描仪
选择一个安装的扫描仪。必须在您的计算机上安装制造商的扫描软件。单击“选项”按钮指定扫描仪选项(仅在Windows中)。
显示扫描仪的用户界面
仅当您希望使用由扫描仪制造商提供的窗口和对话框来查看设置时,才选择此选项。如果未选择此选项,则会直接使用“自定义扫描”或“为下列项目配置预定义设置”界面中指定的设置开始扫描。
页面
指定单面或双面扫描。如果选择了“双面”,但扫描仪的设置仅针对单面,则扫描仪设置将覆盖Acrobat设置。
您可扫描纸张的双面,即使扫描仪本身不支持双面扫描。如果选择了“双面”,扫描完第一面后将显示该对话框。随后您可以将纸盒中的原始纸质文档翻面,然后在该对话框中选择“扫描背面”(“放入图纸背面”)选项。此方法将生成所有页面以正确顺序排列的PDF。
色彩模式(仅Windows)
选择您的扫描仪所支持的基本颜色模式(“自动检测”、“彩色”、“黑白”或“灰度”)。如果“扫描仪选项”设置为使用Acrobat扫描对话框,而不是扫描仪应用程序的扫描对话框,将启用此选项。
分辨率(仅Windows)
选择您的扫描仪支持的分辨率。如果“扫描仪选项”设置为使用Acrobat扫描对话框,而不是扫描仪应用程序的扫描对话框,将启用此选项。
如果选择了扫描仪不支持的“颜色模式”或“分辨率”选项,则会显示一条消息,并打开扫描仪应用程序窗口。请在扫描仪应用程序窗口中选择其它选项。
纸张大小(仅Windows)
选择纸张大小,或者指定自定义宽度和高度。
提示扫描更多页面
选择此选项后,每次扫描会话结束后都会显示一个对话框,提示您扫描更多页面。
质量>优化图像
选择该选项对PDF运行优化过程。该选项用于压缩和筛选扫描PDF中的图像。选择设置图标可使用特定的文件压缩和筛选设置自定义优化内容。
质量>优化图像>小尺寸/高质量
请拖动滑动条来设置文件大小和质量的平衡点。
输出>追加到现有文件
将转换后的扫描文件添加到现有PDF。从下拉列表中选择打开的文件,或浏览并选择PDF文件。
输出>新建PDF
创建PDF。
输出>保存多个文件
从多个纸质文档创建多个文件。选择设置图标,然后指定是否创建包含这些文件的PDF包、是否为每个文件创建页码以及是否创建文件名前缀。
识别文本(OCR)
添加元数据
使其符合PDF/A规范
选择此选项使PDF符合PDF/A-1b的ISO标准。
“增强扫描的PDF”对话框所控制的图像设置用于确定如何针对PDF进行扫描图像的筛选和压缩。默认设置适用于各种文档页面,但是您可能要自定义设置以获得更高质量的图像、较小的文件空间或扫描问题。
应用自适应压缩
将每个页面分为黑白、灰度和彩色区域,然后选择一种在高度压缩每种内容时可保留外观的表现形式。建议的扫描分辨率为300dpi(灰度和RGB输入),或600dpi(黑白输入)。
彩色/灰度扫描
当扫描彩色或灰度页面时,选择以下任一选项:
JPEG2000
为彩色图像内容应用JPEG2000压缩。(创建PDF/A文件时,不建议使用此设置,而建议使用JPEG。)
ZIP
为彩色图像内容应用ZIP压缩。
JPEG
为彩色图像内容应用JPEG压缩。
扫描仪将使用选择的“彩色/灰度”选项或选择的“单色”选项。使用哪个选项取决于您在Acrobat的“扫描”对话框或扫描仪的TWAIN界面中选择的设置,您在Acrobat的“扫描”对话框中单击“扫描”后即可打开相应选项。(默认情况下,扫描仪应用程序对话框不会打开。)
单色扫描
当扫描黑白或单色图像时,选择以下任一选项:
JBIG2(无损)和JBIG2(有损)
应用JBIG2压缩方式于黑白输入页面。最高质量水平使用无损压缩方式;在最低设置下,文本会高度压缩。文本页面通常比CCITT组4压缩的页面小60%,但处理较慢。与Acrobat5.0(PDF1.4)或更高版本兼容。
要与Acrobat4.0兼容,请使用JBIG2以外的其它压缩方法。
CCITT组4
对黑白输入页面图像应用CCITT组4压缩。这种快速的无损压缩方法与Acrobat3.0(PDF1.2)和更高版本兼容。
小文件/高质量
设置文件大小和质量之间的平衡点。
抗扭斜
旋转与扫描仪盖板的边缘不垂直的页面,使PDF页面垂直对齐。选择“开”或“关”。
背景去除
将灰度和彩色输入(不是黑白输入)的近似白色的区域加白。
为了取得最好的效果,校正您扫描仪的对比度和亮度设置以便于扫描的黑白页面有深灰色或者黑色文本和白色背景。然后,使用“关”或者“低”可以生成较佳的效果。如果扫描白纸或者新闻纸,使用“中”或者“高”来使页面清洁。
去网
去除半色调网点结构,它会降低JPEG压缩率,导致龟纹并且使文本难以识别。适用于200至400dpi灰度或RGB输入;或者,对于“自适应压缩”,适用于400至600dpi的黑白输入。“开”设置(建议)适用于300dpi或更高灰度以及RGB输入的滤镜。当扫描不包含图片或者填充区域的页面时,或者扫描时使用的分辨率高于有效分辨率时,请选择“关”。
文本锐化
锐化扫描的PDF文件中的文本。默认值较低且适合大多数文档。如果打印的文档质量不高且文本不清晰,可以提高默认值设置。
文档语言
默认情况下,从默认的区域设置中选取OCR语言。要更改语言,请单击“编辑”,然后选择其它语言。
输出
可搜索的图像或可编辑的文本和图像。
要解决扫描仪错误或问题,请参阅以下故障排除文档:
以300dpi扫描会生成最适合转换的文本。以150dpi扫描时,OCR精度会略有降低。
为OCR引擎指定用于识别字符的语言。
输出(PDF输出样式)
确定要生成的PDF的类型。所有选项都需要72dpi或更高(建议)的输入分辨率。所有的格式应用OCR和字体和页面识别于文本图像并将其转换为正常文本。
可搜索的图像
确保文本是可搜索和可选择的。本选项保持原始图像,根据需要抗扭斜和将不可见文本层放在其上方。在同一对话框中选择“对图像缩减像素采样”可确定是否对图像缩减像素采样以及缩减的程度。
可搜索的图像(精确)
确保文本是可搜索和可选择的。本选项保持原始图像,根据需要抗扭斜和将不可见文本层放在其上方。建议用于要求原始图像最大保真度的情况。
可编辑的文本和图像
合成一个与原始字体非常接近的新的自定义字体,并使用低分辨率副本保留页面背景。
缩减像素采样至
在OCR完成后减少彩色、灰度和单色图像的像素数。选择要应用的缩减像素采样的程度。更高的选项使用较少的缩减像素采样,产生更高分辨率的PDF。
在扫描输出中运行OCR时,Acrobat会对文本位图进行分析,并使用单词和字符替代这些位图区域。如果不确定最佳替代,Acrobat会将其标记为可疑元素。可疑元素在PDF中显示为单词的原始位图,但是文本包含在单词位图后的不可见图层中。采用这种方法,即使单词显示为位图,也可以搜索。