body start
한나눔 한국어 형태소 분석기 (HanNanum)
한나눔 한국어 형태소 분석기 ¶
한나눔 형태소 분석기는 1990년도에 개발되어 현재까지 다양한 분야에서 활용되어 왔습니다. 현재 기존의 C 버전을 기반으로 한 Java 버전의 한나눔이 릴리즈 되었으며 플러그인 컴포넌트 아키텍처를 적용하여 보다 유연하고 확장성 있는 시스템으로 발전시키고 있습니다.
특징 ¶
- 자바 기반이므로 다양한 플랫폼에서 활용 가능
- 형태소 사전 등 형태소 분석에 필요한 중요 리소스를 사용자가 자유롭게 수정하여 이용 가능
- 플러그인 아키텍처를 기반으로 하기 때문에 유연한 활용 및 추가 기능 구현이 매우 용이
- 멀티 쓰레드, 단일 쓰레드 모드 지원
- 유니코드 지원
- KAIST 품사 태그셋을 이용 (
레퍼런스 메뉴얼 참조)
Release 구성 ¶
한나눔 라이브러리 사용방법 ¶
- jhannanum.jar를 라이브러리로 등록
- 프로젝트 홈디렉토리에 data.zip 압축 해제 (HANNANUM_ROOT/data)
- 프로젝트 홈디렉토리에 conf.zip 압축 해제 (HANNANUM_ROOT/conf)
- HANNANUM_ROOT는 Workflow 생성시 설정 가능 - 예) new Workflow("res/hannanum");
- 사용 예제: kr.ac.kaist.swrc.jhannanum.demo.*
한나눔 플러그인 개발 ¶
- JHanNanum 디렉토리를 Eclipse IDE에서 Java Project로 등록
- 구현하고자 하는 단계의 플러그인 인터페이스를 구현하면 바로 한나눔 Workflow에 적용 가능합니다.
참고 문헌 ¶
- 이운재, 김선배, 김길연, 최기선, “모듈화된 형태소 분석기의 구현”, 한국정보과학회 언어공학연구회 학술발표 논문집, pp. 123-136, 1999.
- 신중호, 한영석, 박영찬, 최기선, “어절구조를 반영한 은닉 마르코프 모델을 이용한 한국어 품사태깅”, 한글 및 한국어 정보처리 학술대회, pp. 389-394, 1994.



![[https]](/wiki/hannanum/imgs/https.png)