2013年5月5日日曜日

テキストマイニングとは


■テキストマイニングとは?


http://www.mieruto.com/t001.htm

テキストマイニングとは、テキスト(文章情報)から、有益な情報を採掘(マイニング)するという意味です。

アンケートを思い出していただきますと、いくつかの選択肢にチェックをつけるようなアンケート用紙が多く見受けられます。これでは選択肢のそれぞれは、あらかじめアンケートを作成した側が、想定できる範囲の選択肢しかありません。

ところで、フリーワード欄(自由に文章を書いて答える欄)が用意されているアンケート用紙もあります。「最後に、思ったことをご自由にご記入ください。」といった欄がそれです。

フリーワード欄は、あらかじめ想定した答えではなく、「答える側の本音」がズバリと書かれることが多いのですが、担当者が一枚一枚の用紙を読みながら、有益そうな情報を抜き出す作業は大変です。この作業を効率的に行うことができるシステムが求められてきました。

このように、あらかじめ想定されたものではなく、市場ある膨大なテキストデータから、有益な情報、傾向などを見出して活用することこそが、テキストマイニングの応用の一例となっています。



■テキストマイニングの入門は ぱっとマイニング から

高価で高機能なテキストマイニング・システムが各社から発売されています。高価なテキストマイニング・システムでは、言葉と言葉の関連を図示して見やすくしたり、より高精度な言葉の分解が可能となるなど、素晴らしさをあげればキリがありません。

しかし、どんなに高機能なシステムであっても、使いやすく、わかりやすく、また、テキストマイニングそのものの意味を理解しながら利用できなければ、ただの使わなくなる高価なソフトの仲間入りになってしまいます。

そこで、「ぱっとマイニング」は、基本に忠実なテキストマイニングの「入門用」というべきソフトというコンセプトで開発しました。「一見しただけでは具体的な意味のわからないようなグラフィカルな機能」は搭載していません。

わかりやすい表計算ソフト風のインターフェースを基本とし、自動的に可能な処理も、そう多くはありません。しかし、テキストを分析しようとする入門者には、かなり高度に、また自由度高く利用ができるソフトウエアであると言われています。

ひとつの画面ごとに、ひとつ基本的な機能・分析が搭載されており、組み合わせ方、利用の仕方しだいで非常に価値のある情報を得ることができます。

また、文書をブラウザで表示する機能など、単に文書を分析するだけでなく、文書を選んだり、分類したりするのに便利な機能も搭載しており、まさに、テキストマイニング入門者にとっては、万能ツールを言ってもいいのではないでしょうか。

「ぱっとマイニング」は、テキスト処理を高速に行うため、C++という開発言語で開発し、ストレスなく、観点を変えてサクサクと分析が可能です。

ぱっとマイニングJP(特許版)のダウンロードはこちらへ
http://www.mieruto.com/t007.htm