텍스트 기반 사전이 추가되었습니다.
http://moniwiki.kldp.org/wiki.php/TextDictModule
한글은 조사나 어미가 붙어있는 특징때문에 일반적인 키-값에 대응하는 db로 구현하는것보다 텍스트 기반의 사전을 구현하는 것이 더 나을것으로 보고 구현해보았습니다.
대부분의 공개된 형태소 분석기는 이러한 키-값에 대응하는 db로 구현되어있어서
주어진 문장에 대해 체언 용언을 서치하기 위해서는 반드시 조사나 어미를 분리해야만 했습니다.
또한 사전에 등록되어있지 않은 복합명사에 대해서도 마찬가지의 방식으로 명사를 적당한 방식으로 분리해야하고 사전 서치를 한 후에야 복합명사인지 아닌지 판별이 가능했습니다.
그러나 텍스트기반 사전은 어절을 분리하지 않아도 가장 비슷한 패턴을 찾아줍니다.
regex와 같은 라이브러리사용 없이 가장 간단한 구현으로 사전서치가 가능한 것이죠.