«Если рабочий хочет хорошо выполнять свою работу, он должен сначала заточить свои инструменты» — Конфуций, «Аналитики Конфуция. Лу Лингун»
титульная страница > программирование > Как извлечь изображения в собственном разрешении из PDF-файлов с помощью Python

Как извлечь изображения в собственном разрешении из PDF-файлов с помощью Python

Опубликовано 1 ноября 2024 г.
Просматривать:864

How to Extract Native Resolution Images from PDFs Using Python

Извлечение изображений в собственном разрешении из PDF-файлов в Python

Для точного извлечения изображений из PDF-файлов важно сохранять исходное разрешение и формат файла изображения. PyMuPDF предлагает удобное решение этой задачи.

Для начала импортируйте модуль PyMuPDF и откройте целевой PDF-файл:

import fitz
doc = fitz.open("file.pdf")

Пройдитесь по страницам и извлеките изображения с помощью getPageImageList:

for i in range(len(doc)):
    for img in doc.getPageImageList(i):
        xref = img[0]
        pix = fitz.Pixmap(doc, xref)

В зависимости от типа изображения запишите изображение в формате PNG или преобразуйте изображения CMYK в RGB перед записью в формате PNG:

if pix.n 

Вот дополнительные ресурсы для изучения:

  • [Документация по извлечению изображений PyMuPDF]( https://pymupdf.readthedocs.io/en/latest/image-extraction.html)
  • [Улучшенное извлечение изображений FitZ для FitZ 1.19.6] (https://stackoverflow.com/a/74345380)

С помощью этого решения Python вы можете эффективно извлекать изображения из PDF-файлов, сохраняя их исходное разрешение и формат, обеспечивая точное воспроизведение и анализ.

Заявление о выпуске Эта статья воспроизведена по адресу: 1729554558. В случае каких-либо нарушений, пожалуйста, свяжитесь с [email protected], чтобы удалить ее.
Последний учебник Более>

Изучайте китайский

Отказ от ответственности: Все предоставленные ресурсы частично взяты из Интернета. В случае нарушения ваших авторских прав или других прав и интересов, пожалуйста, объясните подробные причины и предоставьте доказательства авторских прав или прав и интересов, а затем отправьте их по электронной почте: [email protected]. Мы сделаем это за вас как можно скорее.

Copyright© 2022 湘ICP备2022001581号-3