案 > PDFファイル作成処理の失敗チェック > Chrome使用が便利


Windowsソフトで作成したPDFファイルがある。
Windowsソフトの不具合でPDF作成に失敗したかチェックするには。

  • 不具合の特徴
    • 特定ページのグラフ描画欠損
    • グラフタイトルの欠損
    • 凡例の欠損
    • 軸の欠損

TensorFlow案

目視の場合

  • 処理時間: 1枚5秒
  • ファイル数: 90

Deep Learningの場合

正常PDFと異常PDFの訓練データファイルを作成する。
それを用いてTensorFlowで2値クラス分類を学習させる。誤差関数はcross entropy。
学習結果を用いて、通常PDFファイルを処理して「正常」「異常」の判別をする。

上記の処理を5秒 * 90枚 = 450秒以内でできるか。
無理。

今のところ

検討の結果、目視処理の方が今はよさそう。

将来的に処理対象ファイルが9000枚とかになった時には上記のようなものを検討することもありかもしれない。問題は誤認識(「異常」を「正常」ととらえること)をどれほど減らせるか。

複数ファイルアニメーション表示案

複数のPDFファイルを開いて、各ページごとにアニメーション表示する、ようなソフトを実装する。

アニメーションにおいて、違和感の出る部分がPDF作成失敗している。

このようなソフトの実装も450秒ではできない (実力不足)。

linuxコマンドを組み合わせてするというのもありかもしれない。
低優先度で時間が余った時にでも検討する。当分は無理。

Chrome使用

手順

  1. 複数のPDFファイルをChrome上にてタブで開く
  2. 各タブについて以下をする
    • Ctrlを押しながらマウスホイールを回転し、表示を最小にする
    • +マークを2回押して、1.5ページ表示にする
  3. Ctrl+Tabで切り替え表示して異常のチェック
  4. 各タブについて以下をする
    • スペースキーでページ送り
  5. Ctrl+Tabで切り替え表示して異常のチェック
  6. 手順4に戻りすべてのページまで処理する

アニメーションのように表示され、異常ファイルが見つけやすくなる。
ページ送りにはスペースキーを使う。

ページ縮小表示など組み合わせると、なお良い。

タブ切り替え http://qiita.com/7of9/items/06066a0584605b63f081

ファイル数は13くらいは処理できそう。
欲張るとタブ操作時にxマークを押してしまう。

欠損が1つ見つかった。