复制

这指的是打开一个文档,然后将其保存到一个新文件。此测试衡量读取PDF并将其重新写入为新PDF的速度。此过程也是合并/连接多个文档等功能的核心。因此,以下数字适用于PDF的连接和合并。

所有 7,031 页的结果是

600
500
400
300
200
100

3.05
10.54
33.57
494.04
PyMuPDF
PDFrw
PikePDF
PyPDF2
最快
最慢

文本提取

这指的是从文档的每一页提取简单的纯文本,并将其存储在文本文件中。

所有 7,031 页的结果是

400
300
200
100

8.01
27.42
101.64
227.27
PyMuPDF
XPDF
PyPDF2
PDFMiner
最快
最慢

渲染

这指的是以给定的 DPI 分辨率从文档的每一页生成图像(如 PNG)。此功能是 GUI 窗口中显示文档的基础。

所有 7,031 页的结果是

1000
800
600
400
200

367.04
646
851.52
PyMuPDF
XPDF
PDF2JPG
最快
最慢