在Python中從PDF中提取原始解析度影像
為了從PDF中準確提取影像,必須保持原始解析度和格式圖像。 PyMuPDF 為此任務提供了一個方便的解決方案。
首先,匯入 PyMuPDF 模組並開啟目標 PDF 檔案:
import fitz
doc = fitz.open("file.pdf")
迭代頁面並使用 getPageImageList 擷取映像:
for i in range(len(doc)):
for img in doc.getPageImageList(i):
xref = img[0]
pix = fitz.Pixmap(doc, xref)
根據圖像類型,將圖像寫入為PNG 或將CMYK 圖像轉換為RGB,然後再寫入為PNG:
if pix.n 以下是其他可供探索的資源:
- [PyMuPDF 圖片擷取文件]( https://pymupdf.readthedocs.io/en/latest/image-extraction.html)
- [改進了FitZ 影像擷取FitZ 1.19.6](https://stackoverflow.com/a/ 74345380)
使用此Python 解決方案,您可以有效地從PDF 中提取影像,同時保留其原始解析度和格式,確保準確再現和分析。
免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。
Copyright© 2022 湘ICP备2022001581号-3