이상호님의 한글 형태소분석기 KTS를 KLDP.net에 입주시켰습니다.
형태소분석기를 개발하시는 분들에게 도움되시길 바랍니다.
KTS의 특징
- EUC-KR 및 이성진 코드(한글을 영문으로 표현하는 방법중 한가지) 기반
- 경로기반의 태깅 및 상태기반의 태깅 동시 지원
- 각종 사전을 만들기위한 툴이 제공된다.
- 확률기반 처리 및 미등록어 처리 기법 제공
- corpus 자료 제공 (태깅된 5만5천여 문장, 태깅안된 7천여 문장)
변경점
- svn으로 소스관리
- ndbm을 사용하던 것을 db의 ndbm호환모드로 사용하도록 고침
- 소스트리 정리