메뉴 건너뛰기


Computer Science > Information Retrieval

[책소개] Managing Gigabytes

2013.11.29 01:12

푸우 조회 수:3079


검색엔진 개발자가 보아야 하는 필수 도서로 알려진 Managing Gigabytes라는 책입니다.
저도 갖고 있긴 한데... (다 읽어보질 못해서... ^^;)
Gigabytes의 데이터를 다루는 방법에 대해 쓴 책인데...
생각해 보면 Tera도 아니고 Gigabytes가 그리 크지도 않은데... 책 제목을 그렇게 지었네요.
하지만 이책이 쓰여진 시점이 1999년이라는 것을 가만 하면... 뭐 이해 할 수 있을 것 같기도 합니다.
 
책의 내용은 텍스트 데이터의 압축, 인덱싱 방법, 이미지 데이터의 처리 및 인덱싱 방법에 대해 자세하게 작성되어 있습니다.
 
흥미로운 것은 주로 인덱싱과 검색에 대한 이야기를 하고 싶었음에도 불구하고 자료 압축이라는 것에 대해 상당한 비중으로 설명하고 있다는 것입니다.
제 생각으로도 CPU의 성능이 좋아질 수록 대용량의 자료를 처리함에 있어서... 자료의 적절한 압축은 필수항목이 되어 간다는 생각이 듭니다. 
 
검색엔진 개발자의 필독 도서로 알려지긴 했지만...
뭐 제 개인적으로는 책이 영어로 되어 있고 현재는 이런류의 내용을 다룬 책들이 상당 수 있어서... 꼭 필독인지는 사실 잘 모르겠습니다. 
 
하지만 이책의 내용을 기반으로 작성된 mg라는 툴(?)의 소스를 제공하므로 참조 할만 하다 하겠습니다.
 
그리고 검색엔진 개발자가 국제적으로 남들 다 아는 책인데... 자신만 모르면 안되니깐...
책 제목이라도 기억해 놓으심이 신상에 좋을 듯 합니다. 



Managing Gigabytes

Compressing and Indexing Documents and Images

Second Edition, 1999


second edition coverthe three authors at Snowbird, Utah

The second edition of Managing Gigabytes: Compressing and Indexing Documents and Images by Ian H. WittenAlistair Moffat, and Timothy C. Bell, was published in May 1999 by Morgan Kaufmann Publishing, San Francisco (now a component of Elsevier Publishing), ISBN 1-55860-570-3.

Information available:

(Thanks to Art Pollard for the author photograph above).


Links to Other Information

The Arithmetic Coding routines mentioned in Chapter 2, and the compression programs charword, and bits, are available fromhttp://www.csse.unimelb.edu.au/~alistair/arith_coder/.

Specifically interested in coding algorithms? Take a look at Compression and Coding Algorithms; that page also links to more software resources.


Alistair Moffat
ammoffat / unimelb.edu / au
7 May 1999, 1 July 1999, 10 August 1999, January 13, 2013

Mandatory disclaimer: This page, its content and style, are the responsibility of the author and do not necessarily represent the views, policies, or opinions of The University of Melbourne.