今までにない形態素エンジン「マリモ」

検索エンジン Mooterというサービスを提供している、Mooterが新しい形態素エンジンを発表しました。

「マリモ」は一般的な辞書を必要としない、メンテナンス不要の画期的な日本語形態素解析技術です。 - 検索エンジン Mooter

とのことで、従来の辞書を利用した形態素解析エンジンよりずいぶん導入しやすそうな印象を受けます。
20070816mooter

「われわれムーターのマリモでは、形態素に分割する精度は95%程度。すでに十分高いですが、高度な形態素解析エンジンでは98%と、もっと高い。精度では勝てない」(稲村氏)。既存の形態素解析エンジンと真っ向から勝負する気は、稲村氏らにはない。新語や専門用語など、それぞれのユーザーニーズに合わせた文章に特化して自動チューンできる形態素解析エンジン、というのがウリだ。 - 辞書不要の形態素解析エンジン「マリモ」とは − @IT

やはり辞書を使った形態素解析には単純な精度では勝てない模様ですが、その特徴が辞書を使った形態素解析とは違い、未知語・新語などの特定がうまくできるのが特徴となっています。

こうなると、このエンジンと従来の辞書を使ったエンジンの統合手法みたいなものが出てくると面白そうですね。

個人的には、このような従来は「辞書を作らないと無理」と思われていたところを、辞書なしで攻めるという発想の転換は好きです。こういうところから新しい発明ができるといういい例でしょう。