ChatGPT 출시 1년… 한국, 중국, 중동 LLM 모델 앞 다투어 등장
IT 생태계에 격변을 몰고 온 OpenAI의 ChatGPT가 등장한지 이달로 꼭 1년이 되었습니다. ChatGPT 공개 이후 LLM은 어떻게 발전되었을까요? 여러 기업과 기관들은 발 빠르게 한국어 LLM을 출시했고요. LLM 모델들을 선보이는 플랫폼, 일명 ‘리더보드’도 등장했습니다. 국가의 장벽을 넘어 기업과 기관이 협업하는 오픈 연구소도 출연했고요. 자, 그럼 한국어 LLM 엔진들부터 알아보겠습니다. |
한국의 LLM 엔진들한국에는 다음과 같은 다양한 LLM 엔진들이 등장했습니다.
한국지능정보사회진흥원(NIA)와 업스테이지는 누구나 참여해 한국어 언어 모델의 성능을 평가하고 비교할 수 있는 리더보드 ‘Open Ko-LLM 리더보드’를 AI 커뮤니티 플랫폼 허깅페이스(Hugging Face)에 만들었는데요. 여기에는 벌써 300여 개의 한국어 언어 모델들이 올라와 있습니다. 기업과 기관, 학교 등 여러 다양한 조직에서 자유롭게 참여하고 있다고 하는데요. 최근 롯데정보통신의 AI 모델이 리더보드 순위 1위를 차지했다는 소식도 있었습니다. 허깅페이스는 머신러닝 모델을 위한 툴과 리소스를 개발하고 정보를 서로 공유하기 위해 설립된 프랑스계 미국 회사이자 오픈 소스 커뮤니티인데요. 생성형 AI 엔진이 등장하면서 관심도가 폭발적으로 상승했습니다. 여기에선 한국어 LLM 모델을 위한 리더보드만이 있는 것이 아니라 아랍어와 같은 다른 언어의 리더보드들도 살펴볼 수 있습니다. |
영어 외 다른 언어권의 LLM 모델영어 외 다른 언어권의 LLM 모델도 다양하게 선보이고 있는데요. 대표적인 것이 중국어와 아랍어입니다. 아무래도 두 언어를 사용하고 있는 문화권이 넓고 속한 국가도 많다 보니 빠르게 움직이고 있는 것이 아닌가 싶습니다. 중국에서는 10억 개 이상의 매개변수를 갖춘 LLM이 70개 이상 출시되고 있다고도 합니다.
[중국]
[중동]
그리고 일루더AI(EleutherAI)와 같은 비영리 오픈소스 연구 단체도 있는데요. 개발자라면 누구나 제한 없이 사용할 수 있는 오픈소스 LLM을 제공하고 있습니다. 약 1,000여 명의 학술 자원봉사자들로 구성된 프로젝트 조직 빅사이언스(BigScience)가 내놓은 오픈 LLM ‘블룸(BLOOM)’도 있습니다. 빅사이언스는 블룸의 개발을 위해 1년간 60개국 250개 기관의 연구원들이 함께 했다고 하는데요. 여기에는 AI 연구원들뿐만 아니라, 사회 과학, 법률, 윤리, 공공 정책 등 다양한 부문의 전문가들이 참여했다고 합니다. 빅사이언스과 일루더AI 모두 대형 언어 모델 기업에 대응하기 위해 오픈이노베이션을 통한 오픈LLM을 출시한 사례입니다. |
OpenAI의 ChatGPT, Google의 Bard, 메타의 LLaMA 등 널리 쓰이고 있는 LLM들 외에도 이렇게나 다양한 LLM 모델들이 있다는 것이 놀랍지 않으신가요? 고작 1년 동안 이렇게 활발하게 발전되었다면, 앞으로 1년 뒤에는 또 어떤 혁신적인 활동들이 펼쳐질지 상상하기가 어렵습니다.
또 소규모 LLM 모델인 sLLM이 앞으로 더 많이 등장할 것이라고 하는데요. 전 세계 언어 수천 개 중 1,000만 명 이상이 사용하는 언어는 약 20개로 세계 인구의 60%가 사용하고 있습니다. 더욱 다양한 sLLM이 곧 등장할 것이니 흥미롭게 지켜보시면 어떨까요? |
클라우드나 SaaS와 관련하여 다른 궁금한 점이 있으시면 언제든지 저희에게 문의해 주세요.
본 내용은 베스픽 뉴스레터를 통해서 제공되는 내용입니다. 클라우드에 대한 최신 트렌드 정보가 필요하시면 뉴스레터를 구독해 주세요. |