skip menu and go to main content

body start

MoniWiki

  텍스트기반 한글 사전 추가

08.05.07-23:07:59

309036

Submitted by wkpark

 

View1831

 

텍스트 기반 사전이 추가되었습니다.

http://moniwiki.kldp.org/wiki.php/TextDictModule

한글은 조사나 어미가 붙어있는 특징때문에 일반적인 키-값에 대응하는 db로 구현하는것보다 텍스트 기반의 사전을 구현하는 것이 더 나을것으로 보고 구현해보았습니다.

대부분의 공개된 형태소 분석기는 이러한 키-값에 대응하는 db로 구현되어있어서
주어진 문장에 대해 체언 용언을 서치하기 위해서는 반드시 조사나 어미를 분리해야만 했습니다.

또한 사전에 등록되어있지 않은 복합명사에 대해서도 마찬가지의 방식으로 명사를 적당한 방식으로 분리해야하고 사전 서치를 한 후에야 복합명사인지 아닌지 판별이 가능했습니다.

그러나 텍스트기반 사전은 어절을 분리하지 않아도 가장 비슷한 패턴을 찾아줍니다.

regex와 같은 라이브러리사용 없이 가장 간단한 구현으로 사전서치가 가능한 것이죠.

Comments on this artfact

0 Comments