Dehenken 「テキスト抽出技術」は"Denkenken"の独自ブランドです。

製品紹介

 

Dehenkenは、ソフトウェアを開発するお客様(企業)のために、お客様の商品がマーケットでより「競争力」ある商品となるための技術ソフトウェアの提供を行います。

テキスト抽出

デ変研TFライブラリ (高精度・超高速テキスト抽出ライブラリ)

MS-Office、PDF、一太郎等の文書ファイルからテキストを抽出する、組込型のテキストフィルタ(Text Filter)ライブラリです。フォーマットの内部のバイナリデータを解析し、プロパティ情報とテキスト情報を抽出します。その圧倒的な高速性は、全文検索におけるインデキシング生成時間の大幅な短縮化を実現します。

デ変研MFXライブラリ (メールと圧縮ファイルの階層展開ライブラリ)

メールからヘッダ・本文・添付ファイルの情報を取り出す機能と、圧縮ファイルを展開する機能を総合したライブラリです。メールと圧縮ファイルを内部領域に仮展開し、1つ1つのメールの内部情報を取り出すことができます。さらに、複合メール形式のファイル内部に納められたメール情報や、その圧縮前のファイルもひとつひとつ順に取り出すことができます。

DocCat (高精度・超高速テキスト抽出ソフトウェア)

MS-Office、PDF、一太郎等の文書ファイルからテキストを抽出するソフトウェアです。UNIX のcat コマンドのような使い勝手のイメージで、テキスト化を行うことができます。文書フォーマットの内部のバイナリデータを解析し、プロパティ情報とテキスト情報を高精度・超高速に抽出します。全文検索や添付ファイルのテキスト化など、多くのシーンでご使用いただいているテキストフィルタのコマンドです。

全文検索

Cyclopeエンジン(OEMビジネス向け全文検索エンジン)

ソフトウェアにオリジナルの全文検索の機能を備えたいソフトウェアメーカー様、クラウドサービスベンダ様のための、OEM向けに組み込んで利用する全文検索エンジンです。全文検索の機能を搭載した強力なアプリケーションの実現をご支援します。

MailCyclope (電子メールの高速全文検索エンジン)

大量に蓄積保存された電子メールの中から監査したいキーワードを含む特定のメールを高速に全文検索することのできるアプリケーション組込型検索エンジンです。

個人情報ファイル検出

デ変研監査ライブラリ (個人情報ファイル検出エンジン)

ファイル中に存在する人名(名字と名前の組み合わせ)、住所、メールアドレス、郵便番号、電話番号、クレジットカード番号、ID番号を検出するライブラリです。高速パターンマッチ技術を利用し、1回のパターン照合(パスワン:Pass one)で、個人情報にあたる情報を検出します。さらに、各種辞書と照合させることで精度の水準(レベル)を上げます。また、一定の範囲内であれば群とみなすことで個人情報領域(Personal Zone)を見分け、高度な情報検出をします。

フォレンジック

Nepnos (大量ファイルからの複数キーワード検出ツール)

自社開発で実績のあるテキスト抽出とパターンマッチ技術を搭載して「簡単」「高速」「高精度」に大量ファイルから複数キーワードを検出する究極の検出ツールです。機密情報漏洩や不祥事などを厳密に調査しなければならない今日、「Nepnos」は調査人にとってまさに鬼に金棒の支援ツールになるでしょう。

言語認識

Dehenken Language Flow (文字コードと言語の判別ソフトウェア)

言語の記憶辞書(Dictionary of Memorized Languages)を用いて、言語の流れ処理(Stream Processing of Memorized Languages)により、ファイルに書かれたテキストの文字データを順に照合させ、文字コードや言語を検出し、検出後のスコア値により判別のための情報を得るソフトウェアです。

リモートコントロールフレームワーク

Derimo (リモートコントロールフレームワーク)

コントローラとなるスマートフォン、タブレット、PCから、無線LANや3G、LTEなどのネットワークを介してAndroid端末に接続した機器を制御したり、逆に接続機器からの情報をコントローラに表示したりするためのフレームワークソフトウェアです。Android端末に接続する機器としては、カメラや各種センサ、モータなどを想定しています。

クローラ

TeraMillion (大量ドメインから目的とするURLリストを作成する)

.comや.jp等の大量ドメイン名を収集し、所定のキーワードを含むURLリストを作成したり、目的に合ったホームページを選定することができます。
また、過去の情報との差分をとって、差があれば、知らせたり表示したりする目的で利用することができるプロダクトです。