Dehenken 「テキスト抽出技術」は"Denkenken"の独自ブランドです。

Nepnos

大量ファイルからの複数キーワード検索ツール

概要・特徴

大量ファイルからの複数キーワード検出ツール

Nepnosは、自社開発で実績のあるテキスト抽出とパターンマッチ技術(※1)を搭載して「簡単」「高速」「高精度」に大量ファイルから複数キーワードを検出する究極の検出ツールです。機密情報漏洩や不祥事などを厳密に調査しなければならない今日、「Nepnos」は調査人にとってまさに鬼に金棒の支援ツールになるでしょう

★Nepnosが「高速・高精度」のワケは?
Nepnosは、自社開発のテキスト抽出技術を採用しているため、様々な形式のファイルを対象に高精度に検出をすることができます。また、キーワード検出方式は多数のキーワードがあっても一回のパターンマッチ処理で検出する独自のパターンマッチ技術(※1)を採用しています。そのため、キーワードの数が増えていっても検出速度が極端に落ちることはありません。また並列分散処理による実行で更に高速化を図っています。
(※1)特許第4152273号
★Nepnos(ネプノス)とは ―名前の由来―
ギリシャ神話にでてくる正義を嘉(よみ)し悪を罰する神「ネメシス(nemesis)」と人間に優しい眠りの神「ヒュプノス(hypnos)」を組み合わせた造語です。Nepnosは終了予測時間を表示することで調査人が休憩をする手助けができるところから、悪事を探し出す調査人に安眠を…という意味を込めています。

簡単操作

「Nepnos」は高機能でありながら、シンプルなユーザーインターフェースで操作を行っていただけます。基本操作は全て直感的なボタンで行え、手にしたその日から誰もが簡単に使いこなすことができます。マニュアルに頼らず特別なトレーニングもいりません。

日本語環境での強み

「Nepnos」はフォレンジック調査に使用される海外ソフトウェアの多くが抱える日本語処理の以下の課題を解決しています。日本語環境における検出漏れをなくします。
・日本語のマルチバイト文字コードの対応
・大文字小文字全角半角による検出漏れ(例:あ、ア、ア)
・一太郎のような日本独自のファイル形式の対応

緊急時の即時実行に最適

「Nepnos」はあらかじめインデックスを作成しない順次走査方式を採用しています。緊急時に限られた時間内でキーワードを素早く探し出すことができます。また検出キーワードを事前に何通りでも設定できるため、調査現場での入力ミスによる失敗を防げます。

ファイルフォーマットを選ばない

「Nepnos」は自社開発のテキスト抽出ライブラリ(デ変研TFライブラリ/MFXライブラリ)を搭載しているため、文書ファイル・メール(複合形式含む)・圧縮ファイル・日本語テキストファイル・バイナリデータなど様々な形式からキーワードをファイル形式や拡張子、文字コードを意識することなくピンポイントで探し出します。

検出結果が確実に記録される

「Nepnos」の検出結果記録は実行中に逐次、所定の場所に自動保存されます。何らかの要因により途中で中断した場合でも検出結果データが消滅したりしません。検出結果はCSV形式で保存されるため専用ビューアが必要なくどなたでも簡単に参照できます。

検出結果をラクラク参照

「Nepnos」は検出結果のヒットリストにキーワードの前後要約を表示します。ファイルを個別に開かなくても1画面内の情報で検出結果概要が把握できます。ヒットリストの絞り込み機能を使えば大量のヒットリストからターゲットを絞り込むことができます。ファイル内容の参照はテキストビューアにより、本文・ファイル名・プロパティ情報に含まれるキーワードをハイライト表示します。

柔軟な検出条件選択

「Nepnos」なら検出対象を「ファイル名」「プロパティ情報」「本文」の中から自由に選択できます。更に検出対象から除きたい拡張子ファイルや、限定したい拡張子ファイルを組み合わせて検出が行えます。

その他の機能

・正規照合検出
・パスワード保護ファイル・エラーファイル検出 ・バイナリビューア(文字コード自動判定・文字列表示)
・検出結果リストの印刷
・終了予測時間表示
・キーワード登録辞書のインポートとエクスポート
・ヒットファイル格納場所クイックジャンプ
・ファイルを開くアプリケーション登録
・実行途中でのデータ参照、一時停止、実行中断
・ペイン(窓枠)構成のカスタマイズ

画面イメージ

(1) キーワード辞書登録
キーワード辞書(※2)を事前に登録。登録を保存しておけば何度でも同条件で検出できます。
キーワード辞書を登録します。登録を保存しておけば次回の検出時にも同じキーワードで検出できます。登録辞書は検出実行時に選択するため何個登録しても構いません。グループごとにキーワードを登録するためキーワードが多い場合でも分類が容易です。
(2) 対象パス設定
検出対象のフォルダパスを設定。繰り返して検出するパスは保存しておけます。
調査対象のフォルダパスを設定します。検出対象から省きたいパスを設定することも可能です。エクスプローラからドラッグ&ドロップで追加することができます。対象パス単位に使用するキーワード辞書、使用拡張子を複数設定できるため、目的に合った組み合わせを選択できます。対象パスを有効または無効にするのはこの画面で行います
(3) 検出実行
対象パスとキーワード辞書を確認して検出実行。途中経過と中間結果がひと目でわかります。
対象パスの設定準備ができたら、実行ボタンを押して検出を実行します。実行中は経過時間や終了予測時間、ヒット数、未検知数などの情報がリアルタイムに表示されます。ヒットリスト画面には逐次ヒットしたファイル情報が追加されていきます。ヒットリストに現れたファイルは検出終了を待たずに閲覧可能です。実行中に一時停止や中断することもできます。
(4) 結果参照
全体の検出結果が把握しやすい。個別ファイルの閲覧もスピーディ。
検出が終了するとヒットリスト画面に最終結果が表示されます。ヒットリスト画面タブの右側の結果情報タブ画面で今回の検出結果情報が確認できます。ヒットファイルのテキスト抽出内容やプロパティ情報を参照したい時は表示ボタンを押してテキストビューアを開きます (ヒットしたキーワードは全てハイライト表示されます)。実ファイルの格納場所の移動、バイナリデータの閲覧はファイル名をポイントして右クリックから行います。
★キーワード辞書とは(※2)
Nepnosでは、検出するキーワードをグループ化して登録します。それらを一つにまとめたものを「キーワード辞書」と呼んでいます。検出が終了した時のヒットリスト画面ではヒットしたキーワードが属するグループ名が表示されます。
(例) グループ キーワード
  「工場名」 滋賀工場、埼玉工場、無錫工場
  「人 名」 加納、渡邊、林、片桐、久保、畑中
  「書類名」 指示書、仕様書、見積書

Nepnosのマルチスレッド指定の効果

スレッド数とコア数の組み合わせで、処理時間の短縮に効果が出ています。
●環境
CPU Core i7 2700K(@3.5GHz)
HDD 2TB
メモリ 32GB
OS Windows7 SP1(64bit)
●検証条件
データ全容量 8.071GB
ファイル数 16,184ファイル
ご購入について
価格 98万円~(PC1台での稼働ライセンス、初年度の年間保守サービス費を含む、税別)
※複数ライセンス導入やご利用形態による価格はお問い合わせください。 。
年間保守サービスについて
年間保守サービスの内容につきましては「年間保守サービスについて」をご参照下さい。
製品に関するお問い合わせ
詳細をご案内させていただきますので、まずはお気軽にご相談ください。