IIR勉強会 第15回

本日はIIR勉強会でした。本日の会場は初台だったのですが、ちょうどいいタイミングで京王線が止まっているため、慌てて新宿からダッシュ。始まる前に軽く限界でした。京王線が止まっているので、みんなくるのに苦労したようです。


Introduction to Information Retrieval
Introduction to Information Retrieval
Christopher D. Manning (著)
Prabhakar Raghavan (著)
Hinrich Schutze (著)
¥ 7,198 (税込)


本日の内容は、先日の13章の積み残しの部分と14章です。

まずは13章の積み残しのクラシフィケーションの評価の部分。クラシフィケーションの評価とはいっても、その評価の尺度はいろいろあるよー、というようなお話です。マクロ平均とマイクロ平均はすでに混乱しているので、後で復習します。

14章はベクタースペースでのクラシフィケーションです。結構難しい内容なのですが、はさみの部分(ハイレベルな部分)が結構多く、その部分は飛ばすよ?ということなので、予想外に短くなって良かった。

ここでは主にRocchioのアルゴリズムと、k Nearest Neibor(kNN)アルゴリズムの紹介がされています。Rocchioのアルゴリズムというのは、あるアイテムがどこのクラスに属するか判断するのに、各クラスの重心からの距離を用いて、一番近いところに分類しましょうという、比較的単純なアルゴリズムです。これだと、各クラスの分散なんかがうまく考慮できないので、分類したいアイテムの近傍k個のアイテムを取ってきて、そのk個の近傍アイテムのもっとも多数派のクラスに分類させましょう、というのがkNNです。

次回はSVM機械学習の話になります。果たして俺はついて行けるのでしょうか。