从PDF中提取图像

作为 IronPDF 广泛的 PDF 创建和编辑功能集合的一部分,IronPDF 还可通过其内容提取方法促进对 PDF 文档内容的细粒度处理。

extractAllImages 返回嵌入在 PDF 文档中的所有图像的集合,每个图像都格式化为 BufferedImage 对象。

最常见的商业用例是将PDF图片保存在单独的文件中。 上面的代码示例展示了一种使用extractAllImages方法结合Java ImageIO类来实现这一点的方法。

IronPDF还可以以原始字节形式从PDF中提取图像。 为此,请改用extractAllRawImages方法。

也可以从PDF页面的子集中提取图像(而不是整个文档)。 下面的简短代码片段使用extractAllImagesFromPages方法提取示例文档第3页和第7页的图像。

PdfDocument document = PdfDocument.fromFile(Paths.get("sample.pdf"));  
List<BufferedImage> pageRangeImages = document.extractAllImagesFromPages(PageSelection.pageRange(3, 7));
PdfDocument document = PdfDocument.fromFile(Paths.get("sample.pdf"));  
List<BufferedImage> pageRangeImages = document.extractAllImagesFromPages(PageSelection.pageRange(3, 7));
JAVA