自然言語処理に必要となる要素技術で、非構造的な通常の文章から、形態素(mor.pheme)と呼ぶ最小単位の単語を同定する処理をます。文章は、まず分かち書きを行って単語に分割し。次に動詞とか名詞などの品詞に区分する。インターネット・リサーチというとき。インターネットを用いた調査なのか、インターネットに関する調査なのか、というあいまい性がある。従って日本語の解釈ををコンピュータによって実行することには困難をともなう。Webの普及により機械可読型のテキストデータが大量に入手できるようになってきたため、形題素解析のアルゴリズムが現実的な意味で重要になってきた。フリーウェアのソフトウエアとして有名なものに茶筅(ChaSen)がある。

 

出典:マーケティング・リサーチ用語辞典 / 発行所:株式会社 同友館