Dongguk University
김지희 교수 연구실 ‘EMNLP 2025’ 논문 채택
[김지희 교수 연구실(홍민기, 최장호)] Natural Language Processing 분야 Top Conference ‘EMNLP 2025’ 논문 채택
△ 왼쪽부터 동국대학교 컴퓨터·AI학과 홍민기 석사과정, 최장호 석사과정, 동국대학교 컴퓨터·AI학부 김지희 교수
컴퓨터AI학과 김지희 교수 연구팀 (홍민기 석사과정, 최장호 석사과정)이 Natural Language Processing 분야 Top Conference인 EMNLP 2025에 발표한 논문이 최종 채택되었다.
EMNLP (Empirical Methods in Natural Language Processing) 2025는 ACL (Association for Computational Linguistics)에서 주관하는 자연어 처리 및 인공지능 분야의 세계 최고 권위 학회 중 하나로, 실제 데이터 기반의 경험적 방법론과 최신 연구 성과를 다루는 중요한 학술 행사이다. EMNLP 2025는 오는 11월 5일부터 9일까지 중국 쑤저우 국제 엑스포 센터에서 개최될 예정이다.
논문 제목은 ‘NormGenesis: Multicultural Dialogue Generation via Exemplar-Guided Social Norm Modeling and Violation Recovery’으로, 연구팀은 현재 대규모 언어 모델 (Large Language Models)이 저자원 언어 환경에서 사회적 규범을 제대로 반영하지 못하고 대화 품질이 낮은 한계를 해결하기 위해 새로운 접근법을 제안하였다.
이 논문에서는 각 국가의 규범 데이터와 소수의 고품질 전문가 예제를 활용하여 생성된 대화 시나리오를 반복적으로 정제해 문화적으로 적합하고 고품질의 대화 데이터셋을 구축하였다. 또한, 대화 과정에서 규범 위반이 발생하고 이를 회복하는 과정을 담은 Violation-to-Resolution (V2R) 대화 유형을 최초로 제안하였다.
실험 결과, 기존 사회적 규범 대화 데이터셋으로 학습한 모델 대비, NormGenesis 데이터셋으로 학습된 모델이 더 자연스럽고 해당 문화의 규범을 충실히 반영함을 입증하였다.