초록: 이 발표에서는 한국어 오픈소스 파운데이션 모델의 가능성에 대해 이리저리 탐구해 봅니다.
딥 러닝과 자연어 처리(NLP)의 발전은 언어 모델의 성능을 향상시키는 데 크게 기여하였습니다. 그러나 국제적으로 대부분의 연구와 개발은 영어와 같은 주요 언어에 집중되어 왔습니다. 이에 반해, 한국어와 같은 언어는 상대적으로 덜 주목받았습니다.
본 발표에서는 한국어에 특화된 오픈소스 거대 언어 모델의 중요성과 그 가능성을 강조하고, 한국어 데이터에 대한 깊은 이해와 그에 따른 효과적인 언어 생성이 가능해질 것이라는 점에 대해 이야기합니다. 또한, 이러한 모델이 한국어 자연어 처리 연구와 응용 분야에 어떻게 기여할 수 있는지에 대해 여러 국가들에서 진행되고 있는 실질적인 사례를 제시합니다. 또한, 오픈소스의 중요성에 대해 경험을 토대로 설명하고, 이를 통해 연구자들과 개발자들이 자유롭게 모델을 사용하고, 개선하고, 새로운 응용 분야를 개발할 수 있는 부분에 대해 생각해봅니다. 이미 다양한 (특히 이 자리에 와 계신 여러 분들에 의해 진행된) 한국어 오픈소스 언어 모델 연구들과, 이후 가능한 방향성에 대해 짚어봅니다.
한국어 오픈소스 거대 언어 모델의 가능성을 탐구하고, 이를 통해 언어 이해와 생성, 그리고 한국어 NLP 연구가 모두가 사용할 수 있는 실질적인 파운데이션 모델로 이어지기 위해 필요한 다양한 요소들에 대해 함께 생각해 보겠습니다.
Note: 이 자료는 2024년 3월 2일에 열린 LangCon 2024 ( https://2024langcon.oopy.io/1cd05734-ec65-4a32-b20f-ade72714c43f ) 에서 키노트로 발제한 발표입니다. 요청에 따라 2025년 1월 13일에 업로드합니다. 발표 동영상은 Video URL 을 참조해주세요.
ABSTRACT: This presentation explores various possibilities of Korean open-source foundation models.
While advances in deep learning and Natural Language Processing (NLP) have significantly contributed to improving language models, international research and development have primarily focused on major languages like English. In contrast, languages like Korean have received relatively less attention.
The importance and potential of open-source large language models specialized for Korean will be highlighted, including their capacity for deep understanding of Korean data and effective language generation. Practical cases from various countries will be presented to demonstrate how these models can contribute to Korean natural language processing research and applications. The significance of open-source development will be explained through practical experience, along with considerations of how researchers and developers can freely use, improve, and develop new applications with these models. Various Korean open-source language model research efforts (particularly those conducted by many attendees present here) will be examined, followed by a discussion of possible future directions.
The potential of Korean open-source large language models will be explored, along with consideration of the various elements needed to transform language understanding, generation, and Korean NLP research into practical foundation models that everyone can use.