IIR輪講 第19回

本日はIIR輪講の日です。ラス2。本日の内容は「Matrix decompositions and latent semantic idexing」ということで、行列の近似の方法と、それを利用して従来のインデックスをうまくより次元の小さな空間に写像してあげよう、という話です。この章はかなり難しかったので、細かい正確な内容はまだあやふやです。取り合えずアバウトな感覚だけ掴んだ感じ。


Introduction to Information Retrieval
Introduction to Information Retrieval
Christopher D. Manning (著)
Prabhakar Raghavan (著)
Hinrich Schutze (著)
¥ 7,198 (税込)


まず最初しばらくは、行列の復習が入ります。固有値固有行列の求め方から、それらを使って誤差が小さい行列の次元削減の方法の紹介になります。この辺でかなり難しい感じなのですが、基本は行列の定理などなので、落ち着いてゆっくり追っていけば何とか理解できる感じです。

最後に出てくるのが本章の目玉のLatent semantic indexingです。今まで出てきた行列の変形と近似を用いて、より低次元の空間にマッピングするような手法になります。これによって、類義語(違う単語だけど同じ意味)や多義語(同じ単語なのに文脈によって意味が違う)をうまく扱えるようになるとのことです。直感的にはそうなるのかもな〜、と思うのですが、やはり実際に本当にそうなってくれるのか、という懸念も少々ありつつ終了です。

次回はいよいよラストです。最後は3章分まとめて一気にやります!