skip menu and go to main content

body start

한나눔 한국어 형태소 분석기 (HanNanum)

Wiki

Project News

Project Info

  • Development Status: Alpha
  • License: GPL v3
  • Programming Language: Java
  • Topic: Library
  • User Interface: Windows
  • Member count : 10
  • Registered:  : 2009.05.12
  • Activity Percentile:  : 98.53%

activity viewforum,download view

한나눔 한국어 형태소 분석기

한나눔 형태소 분석기는 1990년도에 개발되어 현재까지 다양한 분야에서 활용되어 왔습니다. 현재 기존의 C 버전을 기반으로 한 Java 버전의 한나눔이 릴리즈 되었으며 플러그인 컴포넌트 아키텍처를 적용하여 보다 유연하고 확장성 있는 시스템으로 발전시키고 있습니다.

특징

  • 자바 기반이므로 다양한 플랫폼에서 활용 가능
  • 형태소 사전 등 형태소 분석에 필요한 중요 리소스를 사용자가 자유롭게 수정하여 이용 가능
  • 플러그인 아키텍처를 기반으로 하기 때문에 유연한 활용 및 추가 기능 구현이 매우 용이
  • 멀티 쓰레드, 단일 쓰레드 모드 지원
  • 유니코드 지원
  • KAIST 품사 태그셋을 이용 ([http]레퍼런스 메뉴얼 참조)

Release 구성

  • /JHanNanum - 소스코드, 플러그인 설정 파일, 기반 자료
  • /GUIDemo - GUI 데모 프로그램
  • /data.zip - 기반 자료
  • /conf.zip - 플러그인 설정 파일
  • /jhannanum.jar - 한나눔 라이브러리
  • /COPYING - 라이센스(GPLv3) 정보
  • /README - 안내 문서

한나눔 라이브러리 사용방법

  • jhannanum.jar를 라이브러리로 등록
  • 프로젝트 홈디렉토리에 data.zip 압축 해제 (HANNANUM_ROOT/data)
  • 프로젝트 홈디렉토리에 conf.zip 압축 해제 (HANNANUM_ROOT/conf)
  • HANNANUM_ROOT는 Workflow 생성시 설정 가능 - 예) new Workflow("res/hannanum");
  • 사용 예제: kr.ac.kaist.swrc.jhannanum.demo.*

GUI 데모

  • GUI 기반으로 Plugin을 Workflow에 배치시켜 테스트 가능
  • GUIDemo/execute.bat 실행
  • 실행환경: JRE 1.6 이상

한나눔 플러그인 개발

  • JHanNanum 디렉토리를 Eclipse IDE에서 Java Project로 등록
  • 구현하고자 하는 단계의 플러그인 인터페이스를 구현하면 바로 한나눔 Workflow에 적용 가능합니다.

라이센스

한나눔 한국어 형태소 분석기는 GPLv3를 따르고 있습니다.

참고 문헌

  • 이운재, 김선배, 김길연, 최기선, “모듈화된 형태소 분석기의 구현”, 한국정보과학회 언어공학연구회 학술발표 논문집, pp. 123-136, 1999.
  • 신중호, 한영석, 박영찬, 최기선, “어절구조를 반영한 은닉 마르코프 모델을 이용한 한국어 품사태깅”, 한글 및 한국어 정보처리 학술대회, pp. 389-394, 1994.