Python で PDF からネイティブ解像度画像を抽出する
PDF から画像を正確に抽出するには、元の解像度と形式を維持することが重要です。画像。 PyMuPDF は、このタスクに便利なソリューションを提供します。
まず、PyMuPDF モジュールをインポートし、ターゲット PDF ファイルを開きます:
import fitz
doc = fitz.open("file.pdf")
ページを繰り返し処理し、getPageImageList:
for i in range(len(doc)):
for img in doc.getPageImageList(i):
xref = img[0]
pix = fitz.Pixmap(doc, xref)
画像の種類に応じて、画像を PNG として書き込むか、CMYK 画像を RGB に変換してから PNG:
if pix.n 探索すべき追加リソースは次のとおりです:
- [PyMuPDF 画像抽出ドキュメント]( https://pymupdf.readthedocs.io/en/latest/image-extraction.html)
- [FitZ 1.19.6 用の FitZ 画像抽出の改善](https://stackoverflow.com/a/74345380)
この Python ソリューションを使用すると、ネイティブの解像度と形式を維持しながら PDF から画像を効率的に抽出でき、正確な再現と分析が保証されます。
免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。
Copyright© 2022 湘ICP备2022001581号-3