第1回目 MG勉強会

Managing Gigabytes勉強会に行ってきました。
Nothing found for 2009-03-15-1で募集していたやつです。
今回が第1回目。
メンツ的には半分くらいはIIR勉強会とかぶってます。

この「Managing Gigabytes」という本なのですが、圧縮技術全般、テキスト圧縮から、画像圧縮、検索インデックスの圧縮まで書いた結構マニアックな本です。
IIR本にさらに輪をかけて硬派な本です。
異常に重くてかさばります。。。
全体をぱらぱら見た感じだと、いくつか知った言葉も散見されたので、面白そうな感じです。


Managing Gigabytes: Compressing and Indexing Documents and Images (Morgan Kaufmann Series in Multimedia Information and Systems) (ハードカバー)
Managing Gigabytes: Compressing and Indexing Documents and Images (Morgan Kaufmann Series in Multimedia Information and Systems)
Ian H. Witten (著)
Alistair Moffat (著)
Timothy C. Bell (著)
¥ 10,294


第1回の今回は第1章です。
内容的にはこの本のポジションの説明、なぜ圧縮技術が必要なのか、どんな圧縮技術が必要なのか、この本でそれをどう説明していくのか、という部分の解説です。
以下簡単に怪しげな要約。

100年以上前から、本の完全な索引(concordance)を作る試みというのが行われています。
この作業というのは、いろいろ工夫はされているのですが、どうしてもやはり単調な仕事をひたすらやらなくてはできない作業になってしまいます。
しかし、最近はコンピュータの出現により、この単調な仕事をコンピュータに肩代わりさせることができるようになったため、たくさんの文書(document database)がコンピュータ上に保存されています。
この大量の文書は、何も文字だけではなく、画像や画像化された文書(document image)も入っています。
そのため、この大量のデータを保存するための圧縮技術や、単に保存するだけでなく、取り出して使うための索引技術が必要になってきます。
このそれぞれの技術について、本章以降でその実現方法をみていくことになります。

今回は第1回目なので、懇親会です。
やっぱりこういうコアなメンバーが集まるとおもしろいですね。
端から見ると意味不明な会話だと思いますが。