森友文書で黒塗りしたデータが流出! なぜこんなミスが起きたのかを専門家が検証

6月15日(金)11時0分 文春オンライン

 官公庁がホームページで公開した極秘文書の黒塗り部分が、実は容易に読み取れてしまうことが発覚し、あわてて差し替えたものの、その前の文書がネット経由で拡散してしまうのはよくある話。最近では、財務省が5月23日に公開した「森友学園」の交渉過程を記録した文書がまさにこの状態で、大騒ぎになったのは記憶に新しいところです。


 こうしたミスは、間違ったソフトやツールを使うなど単純な知識不足で起こるパターンもあれば、正しいツールを使っていながらチェックを怠って不完全な処理のまま公開されてしまうパターンもあります。今回の「森友学園」交渉記録文書を例に、典型的なミスの例と、今回実際に起こった例とを見ていきましょう。



今回流出した「森友学園」の交渉記録文書(PDF)。差し替えられる前、数時間にわたって財務省のホームページに掲載されていたバージョンでは、PDF編集ソフトを使うことで黒塗りされた箇所をマウスドラッグで動かすことができました


ミスのほとんどは注釈ツール「長方形」の誤用


「黒塗りが外せる!」と大騒ぎになる時は、本来使うべきツールではなく、無料で入手可能なPDF閲覧ソフト「Acrobat Reader」の注釈ツールに含まれる「長方形ツール」を誤って使っているパターンがほとんどです。


 この「長方形ツール」は、もともと文書の一部分を四角く囲って強調するためのツールですが、枠および内側の色を黒に指定すれば、墨ベタのような外観になります。これを隠したい箇所に貼り付けていけば、下の文字が読めなくなるというわけです。


 しかしこの方法は、いわば紙に付箋を貼り付けているようなものですので、「Acrobat Reader」上でマウスを使ってドラッグすれば簡単に外せてしまいます。しかもこの方法では、長方形ツールひとつひとつに書き込んだユーザの名前および日時が記録されますので、作業の過程が一目瞭然になってしまいます。言うなればもっともレベルが低く、かつ名前まで公開されてしまうという、二重に恥ずかしいミスということになります。



注釈ツールのひとつ「長方形ツール」の色および塗りつぶしの色を変更すると、見た目は黒塗りのような外見に変更できます



ただし下に重なったデータは残ったままで、長方形ツールをドラッグして動かせば容易に見えてしまいます。また右側の一覧に書き込んだユーザの名前まで残ってしまいます


 これと似たパターンとしては、黒く塗りつぶした画像ファイルを用意し、「Acrobat」などPDF編集ソフトで読み込んで貼り付けていくという、やや手の込んだ方法もあります。こちらはPDFそのものを編集していることもあり、「Acrobat Reader」のような閲覧ソフト上で外すことは不可能ですが、重なった下のデータは残ったままで、PDF編集ソフトを使えば見えてしまいますので、あまり意味がありません。



わざとデータを残したまま公開した?


 これに対して、今回話題になった、財務省の交渉記録文書に用いられていた黒塗りの手法は、実はPDFを黒塗りして公開するための、正しい方法が用いられています。その方法とは、「Acrobat Pro」に含まれる「墨消しツール」を使う方法です。



「墨消しツール」。「Acrobat Pro」にのみ含まれる、機密情報を削除するための専用ツールです


 これは、PDF上の文字列をドラッグするか、あるいは範囲選択を行うことで、その範囲を黒く塗りつぶす(墨消し)とともに、重なった下の文字列もしくは範囲を削除できるツールです。作業を終えてPDFを保存する際に重なった下の部分が自動的に削除されるため、保存完了後にPDF編集ソフトでこじ開けても、消されたデータは存在しておらず、見ることができません。



文字列もしくは範囲を選択して、墨消しの適用を行います



重なった下の部分はこのように削除されるため、漏洩の心配はありません


 ところが、今回の財務省の交渉記録文書では、この「墨消しツール」を使って塗りつぶした範囲に、なぜか重なった下の部分のデータが残ったままになっており、PDF編集ソフトで開いて墨消しの部分をドラッグすれば、重なった下の部分が容易に見える状態になっていました。


「Acrobat Pro」の現行バージョンでは、墨消し作業を終えて保存する際、重なった下の部分のデータは自動削除される仕様ですので、むしろどうやってデータを残したまま保存できたのか、謎は深まります。筆者も現物を入手してチェックしましたが、普通に作業をすれば墨消しを行った部分が自動削除されてしまい、正確に再現しようとするとかえって作業過程が煩雑になってしまうなど、実に不可解です。


 該当文書のプロパティを見ると、編集過程の最後で「Acrobat Pro」でない別のソフトが使われた形跡があり、「墨消し」以外の特殊な処理が行われた可能性もありますが、いずれにしても普通に処理していればデータを残すことのほうが逆に難しく、何らかの意図があってわざとデータを残したまま公開したのでは? と思ってしまうほどです。まあ、さすがにそんなことはないでしょうが……。


 ちなみに「Acrobat Pro」では、今回のような事故を防ぐために、墨消し部分にデータが残っているか否かを全ページにわたってスキャンする「非表示情報を検索して削除」およびそれらを一括削除する「非表示情報をすべて削除」というツールも用意されており、これを使えばデータが残存していることが一目瞭然なだけに、これが使われた形跡がないのも不思議です。ものの5分もあれば完了するのですが、それほど急いでいたということなのでしょうか。



「非表示情報をすべて削除」を使えば、作成者情報などあまり外部に出すのがふさわしくない情報をまとめて削除できます


正しいソフトおよびツールを使う方法をマスターしたい


 黒塗りを行うことの是非はさておき、今回のような意図しない流出事故をなくすには、正しいソフト(Acrobat Pro)を用い、正しいツール(墨消しツール)を用いて処理を行うことがまず重要です。注釈ツールを使うのはまったくの論外です。



衆院予算委員会理事懇談会の控え室に運び込まれる「森友学園」に関する文書 ©時事通信社


 また、作業の過程で別のPDF編集ソフトを使ったり、複数人が並行で作業を行うなどして処理が把握しづらくなった場合も、前述の「非表示情報を検索して削除」などのチェックツールを使えば、消したつもりの情報が流出するのを未然に防ぐことができます。


 ちなみに、まったく別の考え方として、墨消しを行ったPDFをいったんすべて紙に印刷し、それを再度スキャナでPDF化する方法もありますが、これだとデータの状態だったテキストがすべて画像に置き換わってしまうデメリットもあるほか、ツールを使いこなせないというITリテラシーの低さを露呈しているようなものですので、個人的にはお勧めしません。


 まずは前述のような正しいソフトとツールを使った操作方法を身につけ、その上で、元のPDFの時点ですべてのページが画像化されているなど画像化のデメリットがないようであれば、念には念を入れるという意味で、試してみてもよいかもしれません。「印刷して再スキャン」が常識としてもてはやされる未来は、正直ご免こうむりたいところです。



(山口 真弘)

文春オンライン

「ミス」をもっと詳しく

「ミス」のニュース

トピックス

BIGLOBE
トップへ