AI/NLP

[NLP스터디] NLP에 필요한 한국어 문법

Mujae98 2024. 1. 20. 21:47

형태소

형태소란 의미를 가지는 요소로서는 더 이상 분석할 수 없는 가장 작은 말의 단위를 말하고 실직형태소와 형식형태소가 있음.(NLP할 때 기본)

  • 실질 형태소(어근): 어휘적 의미를 가진 가장 작은 단위
  • 자립 형태소(접사, 어미, 조사): 문법적 의미를 가진 가장 작은 단위

어근

어근이란 한자뜻 그대로 단어의 가장 근간이 되는 부분이고 9품사 중 조사를 제외한 명사, 대명사, 동사, 형용사, 부사, 감탄사, 수사, 관형사가 있음.
사랑한다에 '사랑', 어른답다에 '어른'이 어근 -> 실질적인 의미를 담당하는 실질형태소

접사

어기 또는 어근에 첨가되어 새로운 의미나 문법기능을 나타내는 형태소로 접두사와 접미사가 있음(파생어를 만드는)
맨손의 맨이 접두사, 선생님의 님이 접미사로 둘 다 어근에 붙어야만 사용이 가능함.

어간과 어미

어간: 활용어(동사, 형용사, 서술격 조사)에서 변하지 않는 부분 -> 보다, 보니, 보고에서 보
어미: 어간과 반대로 변하는 부분을 말하며 점잖다, 점잖으며, 점잖고에서 다, 으며, 고가 어미임
여기서 어미는 또 어말 어미와 선어말 어미와 나뉘는데 '책을 읽었네요'에서 읽은 어간, 었은 선어말 어미, 네요는 어말어미다.

어근과 어간의 차이

우선 어근은 8품사에 해당되고, 어간은 동사, 형용사, (명사)이다 이렇게 세 가지임.
두번째로는 어근은 동사와 형용사에 접사를 포함하지 않지만 어간은 포함함. ex) 샛노랗다에서 어근은 '노랗' 어간은 '샛노랗'임

참고: https://blog.naver.com/PostView.naver?bㅌlogId=zzangdol57&logNo=221533747352&parentCategoryNo=&categoryNo=&viewDate=&isShowPopularPosts=false&from=postView