메뉴 건너뛰기


Computer Science > Language Processing

English 다국어 스태밍 라이브러리 snowball

2013.11.29 00:47

푸우 조회 수:13918

snowball 이라는 스태밍 라이브러리입니다.
 
공식 사이트는 http://snowball.tartarus.org/index.php 입니다.
 
15가지 언어의 명사나 동사 형용사의 원형을 복원하는 라이브러리입니다.
 
지원하는 언어는 다음과 같습니다.
English, French, Spanish, Portuguese, Italian, Romanian, German, Dutch, Swedish, Norwegian 
Danish, Russian, Finnish, Hungarian, Turkish
 
첨부로 The C version of the libstemmer library와 테스트 해볼 수 있는 간단한 툴을 올립니다.
 
참고로 다음의 명령으로 Subversion에서 모든 소스를 다운 받을 수 있습니다.
 
svn co svn://snowball.tartarus.org/snowball/trunk snowball