デ変研MFXライブラリ(以下、本ライブラリ)を用いてアプリケーションを開発するOEMユーザを支援するために、開発しやすく工夫した様々な提供を行います。API使用時のサンプルソース(再利用できる使用権付与)もご提供しています。展開した1つのメールファイルのファイル名を指定してAPIに与え、ライブラリがメール形式や圧縮形式を自動判別し展開します。このときのファイルの判定には拡張子(サフィックスまたは接尾文字)の情報を使いません。
本ライブラリは、メールからヘッダ・本文・添付ファイルの情報を取り出す【メール展開(MX)】機能と、圧縮ファイルの展開をする【圧縮展開(FX)】機能を統合したライブラリです。メールと圧縮ファイルを内部領域に展開し、1つ1つのメールの内部情報を取り出すことができます。さらに mbox や PST(Outlook) といった複合メール形式にも対応しており、複合形式メールの最終個数を返した後、任意の1つのメールを取出し、展開することができます。
1つのメール展開 | EML / OutlookのMSG形式 (EMLは、E-Mail形式のことで、RFC822に準拠したものをいいます) |
||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
複合メール形式 |
|
||||||||||||||||
※1…複合メール形式から展開した1通のE-Mail形式のサイズは2Gbyteまで、またメールの通数は2147483647(signed intの最大値)までとなります。 ※2…MBOX形式に対応しているアプリの1つの例として、Thunderbirdがあります。 ※3…Outlook2002は、2Gbyte以上のサイズのファイルへは対応していません。 | |||||||||||||||||
圧縮ファイル | zip (winzip / pkzip : 圧縮形式 / 自己解凍形式) lha (lh1 / lh5 / lh6 / lh7 : 圧縮形式 / 自己解凍形式) tar+gzip / tgz / gzip rar (圧縮形式 / 自己解凍形式) tar+bzip2 / tbz2 / bzip2 7z (圧縮形式 / 自己解凍形式) ※それぞれの圧縮形式において、パスワード付きのものを除きます |
||||||||||||||||
アーカイブ形式 | tar / gnutar | ||||||||||||||||
メールヘッダのエンコード | メールヘッダのエンコードは、MIME Q/B 及び RFC2231に対応しています。 | ||||||||||||||||
メール本文のエンコード | メール本文のエンコードは、エンコードなし(text/plain)、base64、quoted-printableに対応しています。 | ||||||||||||||||
添付ファイルのエンコード | 添付ファイルのエンコードは、uuencode(MIME形式/本文埋め込み形式)、base64、quoted-printable、binhexに対応しています。 | ||||||||||||||||
パート判別 | E-Mail形式におけるパートの判別方式は、FromとDateヘッダがあり、改行が2つ連続して存在するまでを メールヘッダ、以降をメール本文として扱います。メール本文及びそれ以降が複数のパートで構成されている場合、後続のパート以降は添付ファイルとして扱います。 | ||||||||||||||||
添付ファイル展開 | 添付ファイルがMS-Office (Word / Excel / PowerPoint) / PDF ファイルなどの場合、デ変研TFライブラリと連動して、テキスト抽出後のファイルも取り出すことができます。 | ||||||||||||||||
圧縮ファイル展開 | 添付ファイルが圧縮ファイルであった場合に、圧縮ファイル内を展開して取り出しできます。 添付ファイル中にメールファイルの添付や、圧縮内にメールファイルがあった場合、もしくは、添付ファイルの中にzip 圧縮があり、そのなかに lha 圧縮があるような階層圧縮ファイル、展開して順に取り出すことができます。 |
||||||||||||||||
安全のための限界値設定 | メモリ使用制限 (limit_total_memory) 1つのファイルの制限(limit_one_file) ファイルの使用制限(limit_total_file) ヘッダの最大値の指定(limit_eml_header) メール本文の最大値の指定(limit_eml_body) メールの入れ子展開の階層指定(limit_level) テキストとして取り出す文字コードの指定 (language) |
番号 | TYPE | LEVEL | L_STRING | 備考 |
No.0 | 0 | 0 | EMLファイル全体 | |
No.1 | EML HEADER | 1 | 1 | EMLファイル全体 |
No.2 | EML BODY | 1 | 2 | 本文 |
No.3 | MS OFFICE | 1 | 3 | 1つ目の添付 |
No.4 | PKZIP | 1 | 4 | 2つ目の添付 |
No.5 | MS OFFICE VISTA XLSX | 2 | 4.1 | 2つ目の添付の展開後の内容 |
*** No.0 *** | TYPE | : | |
DATA_SIZE | : | 43557 | |
TEXT_SIZE | : | 0 | |
LEVEL | : | 0 | |
L_STRING | : | 0 | |
NAME | : | (null) | |
STATUS | : | 0 | |
*** No.1 *** | TYPE | : | EML HEADER |
DATA_SIZE | : | 897 | |
DATA_ON_M | : | out_dir.2228_1456884341/MEMORY/data002 | |
TEXT_SIZE | : | 897 | |
TEXT_ON_M | : | out_dir.2228_1456884341/MEMORY/text002 | |
LEVEL | : | 1 | |
L_STRING | : | 1 | |
NAME | : | (null) | |
STATUS | : | 0 | |
*** No.2 *** | TYPE | : | EML BODY |
DATA_SIZE | : | 184 | |
DATA_ON_M | : | out_dir.2228_1456884341/MEMORY/data003 | |
TEXT_SIZE | : | 168 | |
TEXT_ON_M | : | out_dir.2228_1456884341/MEMORY/text003 | |
LEVEL | : | 1 | |
L_STRING | : | 2 | |
NAME | : | (null) | |
STATUS | : | 0 | |
*** No.3 *** | TYPE | : | MS OFFICE |
DATA_SIZE | : | 24064 | |
DATA_ON_M | : | out_dir.2228_1456884341/MEMORY/data004 | |
TEXT_SIZE | : | 186 | |
TEXT_ON_M | : | out_dir.2228_1456884341/MEMORY/data004 | |
LEVEL | : | 1 | |
L_STRING | : | 3 | |
NAME | : | dehenken_word.doc | |
STATUS | : | 0 | |
*** No.4 *** | TYPE | : | PKZIP |
DATA_SIZE | : | 6383 | |
DATA_ON_M | : | out_dir.2228_1456884341/MEMORY/data005 | |
TEXT_SIZE | : | 0 | |
LEVEL | : | 1 | |
L_STRING | : | 4 | |
NAME | : | dehenken_xlsx.zip | |
STATUS | : | 0 | |
*** No.5 *** | TYPE | : | MS OFFICE VISTA XLSX |
DATA_SIZE | : | 9363 | |
DATA_ON_M | : | out_dir.2228_1456884341/MEMORY/data006 | |
TEXT_SIZE | : | 162 | |
TEXT_ON_M | : | out_dir.2228_1456884341/MEMORY/data006 | |
LEVEL | : | 2 | |
L_STRING | : | 4.1 | |
NAME | : | dehenken_xlsx.xlsx | |
STATUS | : | 0 |
Red Hat Linux | AS3 / ES3 / WS3 /AS4 / ES4 / WS4 / EL5 / EL6 / EL7 / EL8 |
---|---|
Windows | 2000 / XP / Vista / 7 / 8 / 8.1 / 10 / 11 |
Windows Server | 2000 / 2003 / 2008 / 2008R2 / 2012 / 2012R2 / 2016 / 2019 / 2022 |
Windows | Microsoft Visual Studio 2008以上 |
---|---|
Linux | Gnu C Compiler(gcc) |
メモリ | 1GB以上 |
---|---|
HDD利用量 | 500MB以上 |
Dehenkenでは、各種フォーマットの文書ファイルから安全にテキストデータを取り出す技術を大切にしています。さまざまな形式のフォーマットから、精度良く・安全に取り出す継続的品質・性能向上活動を「変換道」と呼んでいます。
年間保守サービスの内容につきましては「年間保守サービスについて」をご参照下さい。
詳細をご案内させていただきますので、まずはお気軽にご相談ください。
製品の評価版をご請求頂くフォームです
評価版請求フォーム