728x90 Natural Language Processing/Data Augmentation1 [Data Augmentation in NLP] 1. NLP에서 데이터 증강 하는 방법 자언어 처리 프로젝트를 진행하다보면, 성능을 높이기 위해 고려되는 방법 중 하나로 "데이터 증강" 이 있다. 데이터 증강에도 여러가지 방법이 있는데, 하나씩 알아보면서 실제 모델을 만들고 패키지로 제공하려고 한다. Paraphrasing-based methods 데이터를 증강하기 위해 아래 그림과 같이, 단어 레벨, 구문 레벨, 문장 레벨로 데이터를 증강하는 방법이 있다. 그 중, 첫번째로 Thasaurus방식에 대해 먼저 알아보고자 한다. Thasaurus (유의어로 대체) 문장이 있을 때, 특정 단어를 비슷한 의미를 가진 단어로 대체하는 방법이 있다. 예를 들어, "나는 정말 굉장한 일을 하고 있어" 라는 문장이 주어졌을 때, "굉장한" 이라는 단어를 "엄청난" 이라는 단어로 바꾸는 것이다. 따라서 .. 2023. 5. 25. 이전 1 다음 728x90