【Python】PDFを画像ファイル(PNG/JPEG)に変換する方法

python
スポンサーリンク
ピーター
ピーター

PythonでPDFを画像ファイルに変換したい!

今回はPythonでPDFを画像ファイル(PNG/JPEG)に変換するための手順について、備忘録として記載します。



pdf2image/popplerのインストール

pipでインストールしている場合のコマンド

pip install pdf2image
pip install poppler

pdf2imageの情報はこちらです。
https://github.com/Belval/pdf2image

popplerの情報はこちらです。

Poppler

Pythonのコード

from pathlib import Path
from pdf2image import convert_from_path

input_pdf_path = Path('in_pdf/sample.pdf')
image_dir = Path('out_image')
out_format = 'jpeg'

images = convert_from_path(pdf_path = input_pdf_path, dpi = 300, fmt = out_format)

for i, image in enumerate(images):
    out_image_path = image_dir / pathlib.Path("img_{}_{}.{}".format(input_pdf_path.stem, i + 1, out_format))
    image.save(out_image_path, out_format)

PDFをImageに変換する関数(convert_from_path)パタメータは主に以下のような設定があります。

  • pdf_path:変換するPDFのファイルパス
  • output_folder:変換後に保管するフォルダパスの設定
  • dpi:変換後の解像度になります(デフォルトは200dpi)
  • fmt:変換時の画像フォーマット(jpeg/png/ppm、デフォルトはppm)
  • grayscale:グレースケール変換の設定(デフォルトはFalse)
  • timeout:タイムアウトする時間の設定(デフォルトは600)

パソコンの性能によっては、PDFのページ数が多い場合にエラーとなってしまうケースがあります。

その回避方法についてもはこの記事を参考にしてください!

PDFデータでパスワードが掛かっている場合や解除したい場合があります。その場合は、こちらの記事を参考にしてください

逆に画像ファイル(PNG/JPEG/JPG)からPDFファイルに変換する方法はこちらの記事で紹介しています。

コメント

ランキング

タイトルとURLをコピーしました