フリーソフトPoppler/xpdfを使用してPDFの解析や変換を行ってみました。
PopplerとはPDFビューア(XpdfReader)やPDF解析・変換ツールのフリーソフトです。PopplerはXpdf(フリーソフト)をベースとして機能を拡張して提供されています。
ソースコードも提供されているライブラリとなります。コマンドライン実行のため、VBAや他プログラムからも利用可能となります。
| 開発元 | freedesktop.org (非営利団体) |
|---|---|
| ライセンス | GPL Version 2(商用利用も可能なフリーソフト) |
| 公式サイト | poppler.freedesktop.org |
| 動作環境 | Windows、macOS、Linuxなど様々なOSで動作可能 |
xpdfはPDF ビューア(XpdfReader)の他に,次のような PDFツール(command line tools)が提供されています。
| 主な機能 | 概要 |
|---|---|
| pdfattach | PDFファイルに添付ファイルを埋め込みします |
| pdfdetach | PDF内に添付(埋め込み)されているファイルの一覧表示や抽出を行います |
| pdffonts | PDFファイルで使用されているフォントやフォントの埋め込み有無を調べる |
| pdfimages | PDFファイルで使用(埋め込み)されている画像を抽出する |
| pdfinfo | PDFファイルの情報(作成者、作成日時、ページ数など)を表示する |
| pdfseparate | PDFファイルを1ページごとに分割する |
| pdftocairo | PDFファイルを画像に変換する(Cairoベクターグラフィックスを使用) |
| pdftohtml | PDFをHTML形式に変換する |
| pdftoppm | PDFファイルを画像に変換する |
| pdftops | PDFファイルをPostScriptファイルに変換する |
| pdftotext | PDFファイルからテキストを抽出する |
| pdfunite | 複数のPDFファイルをページ結合する |
「https://github.com/oschwartz10612/poppler-windows/releases」よりzipをダウンロードします。通常は最新バージョンをダウンロードしてください。

zipを解凍すると、以下の「bin」ディレクトリにコマンド(exe)が格納されています。
インストラーではなく、コマンドがそのまま実行可能です。

exeを直接実行することもできますがパスを登録することで、exeまでのフルパスを指定しなくてもコマンド実行可能となります。
タスクバー「検索ボックス」に「path」と入力→表示される「システム環境変数の編集」を選択

「システムプロパティ」の「詳細設定」タブ→「環境変数(N)」を選択

「path」を選択→「編集」を選択

zip解凍した「bin」ディレクトリのフルパスを追加して「OK」を選択

コマンドプロンプトで「 pdfinfo -v 」を実行すると、インストールしたバージョンが表示されればOKです。

「 brew install poppler 」コマンドを利用します。
「 sudo apt-get install poppler-utils 」
「 sudo yum install poppler-utils 」
等のコマンドを利用します。
※Linuxディストリビューションより異なりますのでご注意ください。