====== PDF の編集 ======
===== 概要 =====
* Word で作った文書を PDF に変換した時に、作成者やタイトルなどのメタ情報が残る。
* 日本語タイトルの文書は最悪の場合、これらが文字化けして、見栄えが悪くなる
* 特にブラウザに組み込まれた PDF ビューアが文字化けのタイトルを表示する
* 外部に公開する PDF などセキュリティ(?)の都合上、あまりよろしくないので削除してみる
* あるいは、PDF にパスワードをかけてみる
* 既にコメントやハイライトでベッタベタにした PDF を配布するため、コメントやハイライトなどをすべて削除する
===== 方法 =====
* pdftk
* [[#PDFにパスワードをかける]]
* [[#保護ためのパスワードの設定]]
* [[#文書を開くためのパスワードの設定(印刷はさせない)]]
* [[#PDFのメタ情報を編集・削除する]]
* rewritepdf
* [[#コメントやハイライトをすべて削除する]]
==== pdftk を使う方法 =====
* インストール\\ $ sudo apt-get install pdftk
* パスワードをかけるなら pdfchain という GUI のツールもある
* 参考サイト
* PDF にパスワードをかける情報 [[https://www.softel.co.jp/blogs/tech/archives/3496 | パスワード付きのPDFを作成する at softelメモ]]
* PDF からメタデータを削除する情報 [[https://sangonz.wordpress.com/2010/04/11/how-to-edit-pdf-metadata-maclinuxwindows/ | How to edit PDF metadata (Mac/Linux/Windows) | I failed the Turing Test!]]
=== PDFにパスワードをかける ===
* パスワードには2種類ある
* owner_pw: 所有者パスワード (PDF の機能を制限するためのパスワード)
* owner_pw を加えることにより、印刷などの機能を制限できる
* owner_pw だけでは、閲覧制限はかけられないため、user_pw も合わせてかける必要がある
* user_pw: ユーザパスワード (ファイルを開くためのパスワード)
=== 保護ためのパスワードの設定 ===
$ pdftk INPUT.pdf output OUTPUT.pdf owner_pw PASSWORD
* ''INPUT.pdf'': 入力ファイルとなる PDF ファイルのパス
* ''OUTPUT.pdf'': 出力ファイルのパス
* ''PASSWORD'': 設定するパスワード
=== 文書を開くためのパスワードの設定(印刷はさせない) ===
$ pdftk INPUT.pdf output OUTPUT.pdf user_pw PASSWORD
* ''INPUT.pdf'': 入力ファイルとなる PDF ファイルのパス
* ''OUTPUT.pdf'': 出力ファイルのパス
* ''PASSWORD'': 設定するパスワード
=== 印刷のためのパスワードの設定 ===
$ pdftk INPUT.pdf output OUTPUT.pdf owner_pw PASSWORD allow printing
* ''INPUT.pdf'': 入力ファイルとなる PDF ファイルのパス
* ''OUTPUT.pdf'': 出力ファイルのパス
* ''PASSWORD'': 設定するパスワード
* この例だと印刷を許可する
=== PDFのメタ情報を編集・削除する ===
- メタ情報の抜き出し\\ $ pdftk INPUT.pdf dump_data > メタ情報ファイル.txt
* ''INPUT.pdf'': 入力ファイルとなる PDF ファイルのパス
- メタ情報ファイル.txt を編集する
* ''InfoKey'': メタ情報の項目
* ''InfoValue'': 項目の情報
- メタ情報ファイル.txt の内容を PDF に適用して変換する\\ $ pdftk 入力PDFファイル.pdf update_info メタ情報ファイル.txt output 出力PDFファイル.pdf
==== rewritepdf を使う方法 ====
* インストール\\ $ sudo apt-get install libcam-pdf-perl
* コメントやハイライトをすべて削除する\\ $ rewritepdf -C 入力ファイル.pdf 出力ファイル.pdf
* 参考サイト: [[http://superuser.com/questions/221711/batch-remove-comments-from-pdf-files | Batch remove comments from PDF files - Super User]]
===== PDF のセキュリティを解除する方法 =====
* PDF の中には、パスワードなしで印刷やコメントをできなくするセキュリティプロパティが設定されているものもある。解除するには、以下のコマンドを実行する。\\
$ qpdf --decrypt INPUT.pdf OUTPUT.pdf
* 参考サイト: [[https://superuser.com/questions/367184/pdf-removing-usage-restrictions | linux - PDF - removing usage restrictions - Super User]]
* パスワードが設定されている場合は、''--password'' オプションを使用する。\\
$ qpdf --decrypt INPUT.pdf OUTPUT.pdf --password=PASS
* 参考サイト: [[https://reject.tokyo/qpdf-delete-pdf-guard/ | パスワード による機能制限がかかった PDF を解除する qpdf]]
===== Tips =====
* Ubuntu 18.04 で ''pdftk'' をインストールする方法
* [[https://askubuntu.com/questions/1028522/how-can-i-install-pdftk-in-ubuntu-18-04-bionic | software installation - How can I install pdftk in Ubuntu 18.04 Bionic? - Ask Ubuntu]]
{{tag>PC Linux コマンド ファイル}}