PDF の編集
概要
- Word で作った文書を PDF に変換した時に、作成者やタイトルなどのメタ情報が残る。
- 日本語タイトルの文書は最悪の場合、これらが文字化けして、見栄えが悪くなる
- 特にブラウザに組み込まれた PDF ビューアが文字化けのタイトルを表示する
- 外部に公開する PDF などセキュリティ(?)の都合上、あまりよろしくないので削除してみる
- あるいは、PDF にパスワードをかけてみる
- 既にコメントやハイライトでベッタベタにした PDF を配布するため、コメントやハイライトなどをすべて削除する
方法
- pdftk
- rewritepdf
pdftk を使う方法
- インストール
$ sudo apt-get install pdftk
- パスワードをかけるなら pdfchain という GUI のツールもある
- 参考サイト
- PDF にパスワードをかける情報 パスワード付きのPDFを作成する at softelメモ
- PDF からメタデータを削除する情報 How to edit PDF metadata (Mac/Linux/Windows) | I failed the Turing Test!
PDFにパスワードをかける
- パスワードには2種類ある
- owner_pw: 所有者パスワード (PDF の機能を制限するためのパスワード)
- owner_pw を加えることにより、印刷などの機能を制限できる
- owner_pw だけでは、閲覧制限はかけられないため、user_pw も合わせてかける必要がある
- user_pw: ユーザパスワード (ファイルを開くためのパスワード)
保護ためのパスワードの設定
$ pdftk INPUT.pdf output OUTPUT.pdf owner_pw PASSWORD
INPUT.pdf
: 入力ファイルとなる PDF ファイルのパスOUTPUT.pdf
: 出力ファイルのパスPASSWORD
: 設定するパスワード
文書を開くためのパスワードの設定(印刷はさせない)
$ pdftk INPUT.pdf output OUTPUT.pdf user_pw PASSWORD
INPUT.pdf
: 入力ファイルとなる PDF ファイルのパスOUTPUT.pdf
: 出力ファイルのパスPASSWORD
: 設定するパスワード
印刷のためのパスワードの設定
$ pdftk INPUT.pdf output OUTPUT.pdf owner_pw PASSWORD allow printing
INPUT.pdf
: 入力ファイルとなる PDF ファイルのパスOUTPUT.pdf
: 出力ファイルのパスPASSWORD
: 設定するパスワード- この例だと印刷を許可する
PDFのメタ情報を編集・削除する
- メタ情報の抜き出し
$ pdftk INPUT.pdf dump_data > メタ情報ファイル.txt
INPUT.pdf
: 入力ファイルとなる PDF ファイルのパス
- メタ情報ファイル.txt を編集する
InfoKey
: メタ情報の項目InfoValue
: 項目の情報
- メタ情報ファイル.txt の内容を PDF に適用して変換する
$ pdftk 入力PDFファイル.pdf update_info メタ情報ファイル.txt output 出力PDFファイル.pdf
rewritepdf を使う方法
- インストール
$ sudo apt-get install libcam-pdf-perl
- コメントやハイライトをすべて削除する
$ rewritepdf -C 入力ファイル.pdf 出力ファイル.pdf
PDF のセキュリティを解除する方法
- PDF の中には、パスワードなしで印刷やコメントをできなくするセキュリティプロパティが設定されているものもある。解除するには、以下のコマンドを実行する。
$ qpdf --decrypt INPUT.pdf OUTPUT.pdf
- パスワードが設定されている場合は、
–password
オプションを使用する。
$ qpdf --decrypt INPUT.pdf OUTPUT.pdf --password=PASS
Tips
- Ubuntu 18.04 で
pdftk
をインストールする方法