从PDF中提取图像
作为 IronPDF 广泛的 PDF 创建和编辑功能集合的一部分,IronPDF 还可通过其内容提取方法促进对 PDF 文档内容的细粒度处理。
extractAllImages
返回嵌入在 PDF 文档中的所有图像的集合,每个图像都格式化为 BufferedImage
对象。
最常见的商业用例是将PDF图片保存在单独的文件中。 上面的代码示例展示了一种使用extractAllImages
方法结合Java ImageIO
类来实现这一点的方法。
IronPDF还可以以原始字节形式从PDF中提取图像。 为此,请改用extractAllRawImages
方法。
也可以从PDF页面的子集中提取图像(而不是整个文档)。 下面的简短代码片段使用extractAllImagesFromPages
方法提取示例文档第3页和第7页的图像。
PdfDocument document = PdfDocument.fromFile(Paths.get("sample.pdf"));
List<BufferedImage> pageRangeImages = document.extractAllImagesFromPages(PageSelection.pageRange(3, 7));
PdfDocument document = PdfDocument.fromFile(Paths.get("sample.pdf"));
List<BufferedImage> pageRangeImages = document.extractAllImagesFromPages(PageSelection.pageRange(3, 7));
如何用 Java 从 PDF 中提取图像
- 安装 IronPDF Java 库
- 使用 `extractAllImages` 方法从 PDF 中提取图像
- 遍历图像集合对象中的每张图像
- 用 Java 中的 "write "方法导出提取的图像
- 在不影响原始 PDF 的情况下进行提取