如何去掉pdf文档的黑边

关于去黑边问题简答如下:

黑边有两种:“切到肉的”(即黑边部分地覆盖了文字的)和“未切到肉的”。这里只谈谈“未切到肉的”的情形。再分为两种情况:

1. 只有黑边,其他的污迹不多。办法是在Acrobat 5之中用“Square Tool”覆盖黑边(要点:把Square的边框和中心均选为白色),存盘后,在Acrobat 6之中做“Page Capture”(即OCR),然后在Acrobat 6之中删去这些方块,被覆盖的黑边就没有了。

不在Acrobat 6之中覆盖黑边的理由是:即便覆盖了,OCR后被覆盖的黑边依然存在。

不在Acrobat 5之中做OCR的理由是:对非两值扫描(1 bit/pixel)的页面,OCR后会呈淡灰色,不好;识别率不及Acrobat 6,经常莫名其妙地OCR失败。

在Acrobat 6之中删去方块,可以一次操作把整个文件的“方块”全部删去,试试。

2. 其他的污迹较多。可以用Acrobat 6将pdf文件分拆成图形文件(每页一个文件),再用图形加工软件逐一清理。分拆方法:在Acrobat 6之中,用“Save As”,选择文件类型为“tif”(在“options”中,两值压缩用CCITT4,灰度压缩用LZW),然后存盘,分拆就完成了。页面清理建议使用Paintshop 5(不要使用其高版本!),其“Shapes Tool”可以快捷地去除污迹。

这些图形文件的合并(成pdf),用Acrobat可以快速进行,这是后话。

选择“.tif”格式的理由:这是无损存储格式,来回转换不会降低页面质量。鄙人曾选用“.jpg”格式,造成质量损失,也作后话了。

建议不要使用某些合并软件来从图形文件生成pdf文件。理由也是相仿的。