한국어
    • 한국어
    • ENGLISH
    • 日本語
    • 中文-繁體

    2023.08.16 AI

    엔씨, 자체 개발 언어모델 VARCO LLM 공개

    엔씨가 언어모델 VARCO LLM을 공개합니다. VARCO LLM은 엔씨에서 자체 개발한 언어모델로 올해 대/중/소 규모에 따라 차례로 공개할 예정입니다. 처음 소개할 모델은 매개변수 13억, 64억, 130억 개 규모입니다. 기사에서는 이 모델들의 특징과 비전을 살펴봅니다. 엔씨가 제시하는 언어모델의 새로운 가능성에 공감해주시기를 바랍니다.

    VARCO, AI를 통해 독창성을 실현하세요

    작년 말부터 전 세계 글로벌 기업들이 가장 크게 고민한 일은 ‘생성형 AI 모델을 어떻게 활용해야 수익을 창출할 수 있을까?’일 것이다. 엔씨는 그동안 꾸준히 AI와 NLP 분야를 연구해왔기에 이러한 시대 흐름이 반가웠지만, 고민의 방향은 달랐다. 엔씨는 인공지능이 다양한 소통과 창작 활동을 도울 수 있다는 데 주목했다. 주요 목표인 디지털 휴먼 제작과 게임 개발의 생산성을 높이는 데 기여할 수 있다고 믿었기 때문이다. 이 목표를 이루기 위한 핵심 요소가 대형 언어모델이라 판단한 엔씨는 곧바로 개발에 착수했다.

    엔씨가 생각하는 인공지능의 역할과 R&D 비전은 창조적 과정에서 인간과 ‘AI’를 확고한 동맹 관계로 바꾸는 것이다. 복잡한 작업을 단순하게 만들고 반복적 작업을 자동화하여 개인이 창의적인 잠재력을 발휘할 수 있도록 돕는 것이다. 엔씨의 자체 AI 언어모델이자 통합 브랜드 명칭인 ‘VARCO’에도 같은 메시지를 담았다. ‘Via AI, Realize your Creativity and Originality’, 즉 AI를 통해 독창성을 실현하라는 뜻이다.

    엔씨는 인간이 AI를 통해 창작과 일의 본질에 집중하고 발전시켜가기를 바란다. 이 가치를 실현하기 위해 엔씨는 ‘VARCO’라는 이름의 다양한 AI 연구 및 사업을 펼칠 예정이다. 이번 발표를 시작으로 올해 대/중/소 규모의 언어모델을 공개하고, 다양한 파트너들과 기술 협력을 진행한다. 또한 AI 플랫폼 서비스 ‘VARCO Studio’ 개발을 완료해 아트 창작, 시나리오 작성 등 게임 제작 공정 전반에 활용한다는 계획이다.

    VARCO LLM 로드맵

    VARCO는 창조를 조력할 뿐만 아니라 더 나아가 게임에 새로운 경험을 더할 수 있다. 디지털 휴먼 생성 기술과 결합하여 한 차원 높은 인터랙션을 구현함으로써 생생한 몰입감을 부여할 수 있다. 엔씨는 목표와 전략에 따라 최적화한 모델을 개발하고 기반 기술을 연결해 다양한 서비스를 선보일 예정이다.

    첫 번째 VARCO LLM, 경제성과 실용성을 갖춘 맞춤형 언어모델

    VARCO LLM은 엔씨가 처음부터 고품질 사전 학습 데이터를 사용하여 학습시킨 고성능 언어모델이다. VARCO 언어모델은 크게 ▲ 기초 모델(Foundation Model), ▲ 인스트럭션(Instruction) 모델, ▲ 대화형 모델, ▲ 생성형 모델 4종류로 분류하며, 매개변수 규모에 따라 성능을 구분한다.

    이번에 공개한 언어모델은 매개변수가 13억, 64억, 130억 개인 모델이다. 모델의 종류는 기본 모델인 기초 모델과 지시문으로 튜닝하여 원하는 목적으로 사용할 수 있는 인스트럭션 모델 두 가지로 구성된다.

    일반적으로 언어모델의 매개변수가 커지면 성능이 급격하게 좋아지고, 그만큼 운영비가 높아진다. 매개변수가 130억 개 이하인 소형/중형 모델은 구동을 위한 슈퍼컴퓨팅 능력이 필요 없고, GPU 서버 1대에서 구동할 수 있기 때문에 경제적이다. 또한 적은 컴퓨팅을 활용해 학습할 수 있고, 특정 도메인 언어에 특화된 서비스가 가능하기 때문에 맞춤형 모델을 만들어 서비스하기에도 용이하다.

    국내 최초 아마존웹서비스 마켓 입점

    VARCO LLM은 국내 최초로 아마존웹서비스(Amazon Web Services, AWS) 세이지메이커 점프스타트(Sagemaker JumpStart)를 통해 배포된다. 고객은 모델을 사용하는 데 필요한 인프라를 직접 구매하여 AWS 위에서 모델을 사용할 수 있다. 세이지메이커 점프스타트는 AWS의 완전 관리형 기계 학습(machine learning) 서비스로, 기계 학습 모델을 쉽게 구축, 학습, 배포할 수 있는 통합 개발 환경을 제공하는 오픈마켓 플랫폼이다. 오픈소스로 공개되는 것은 아니지만, AWS와의 협업을 통해 전 세계 이용자들이 언제 어디서든 한 달간 무료로 VARCO LLM을 사용할 수 있다. 더불어 엔씨는 물론 어디서도 접근할 수 없는 자신만의 AWS 인프라의 모델을 사용하기 때문에 고객 데이터 보안에도 유리하다.

    아마존웹서비스 바로가기

    아마존웹서비스 내 NCSOFT 페이지

    엔씨는 언어모델을 활용해 고부가가치 결과물을 만들어낼 수 있도록 여러 기업과 기술 협력을 앞두고 있다. 특히 수직(Vertical) 영역에 초점을 맞춘다. 각각의 수직 영역은 고유한 특성과 요구 사항이 있기 때문에 일반적인 언어모델을 빠르고 정확하게 적용하기 어렵다. 엔씨는 각 도메인의 특수성에 맞춰 시장에 특화된 종합적 AI 솔루션을 개발하고 있다.

    이러한 배경에서 엔씨의 언어모델은 다른 기업들이 쉽게 활용하고 글로벌 성장을 이루는 데 적합한 도구가 될 것으로 기대된다. VARCO LLM은 모델 크기가 같다면 대화와 생성에서 더 높은 성능을 발휘하도록 학습되었기 때문에, 큰 비용 없이도 다른 도메인에서 AI를 적용하고 싶을 때 빠르게 사용할 수 있다. 또한 데이터 수집부터 사전 학습, 튜닝 등 모든 과정을 직접 진행한 만큼 다양한 상황에서 모델의 생성을 예측할 수 있다는 장점이 있다. 예를 들어 언어모델 사용 도중 문제가 발생하면 학습된 모든 데이터를 재조정하거나 점검할 수 있으므로 향후 다른 서비스와 접목할 때 효과적으로 모델을 컨트롤할 수 있다.

    바이링구얼 모델과 윤리 엔진

    엔씨의 언어모델은 한국어와 영어 언어 처리를 모두 지원하는 단일 바이링구얼 모델이다. 한 모델로 두 가지 언어를 동시에 다룰 수 있으므로 별개의 언어 모델을 각각 사용하는 것보다 비용이 낮고, 다양한 도메인에서 빠르게 적용할 수 있다는 강점이 있다. 엔씨의 모델은 국내 다수 대학과의 산학 협력을 통해 취합한 고품질의 한국어 데이터와 기존의 영어 데이터를 모두 학습하여 두 언어에 능숙하다. 이를 통해 언어 간의 상호작용이나 번역, 다국어 서비스 등의 편의를 제공한다.

    사전 학습 데이터  

    엔씨의 언어모델은 AI 윤리 문제에도 진지하게 대응한다. 엔씨는 특히 학습 데이터 수집에 엄격한 기준을 적용했다. 인터넷에 공개된 내용이라 하더라도 무분별하게 수집하지 않았고, 여러 경로로 검증된 웹사이트들만 학습에 반영했다. 또한 별도의 AI 윤리 엔진을 개발하여 광범위하게 데이터를 필터링했다. 이 윤리 엔진은 개인정보가 포함되어 있거나 편향적인 데이터를 필터링할 뿐만 아니라, 비윤리라는 범위를 넘어 무례한 표현과 화법, 홍보성 내용 등을 필터링할 수 있도록 문장 단위 검증을 수행한다.

    창의적으로 활용하는 AI

    특히 VARCO는 게임 개발에 특화된 고품질 콘텐츠를 제작할 수 있는 모델이다. 게임 개발에 필요한 기획, 운영, 아트 등의 분야에서 효율성을 적극 높일 수 있다. VARCO는 게임 내 텍스트나 시나리오 등의 관련 콘텐츠 개발을 우선적으로 고려하며 데이터를 학습했다. 저작권이 공개된 각국의 서적들을 번역하고, 다양한 페르소나 대화 데이터를 직접 구축했다. 몰입감 있고 깊이 있으며 논리적인 대화 데이터를 학습한 VARCO는 생동감 있는 게임 콘텐츠를 제작할 수 있는 모델이다.

    VARCO LLM을 기반으로 만든 AI 플랫폼 서비스 ‘Varco Studio’.

    ▲이미지 생성툴(VARCO-Art) ▲텍스트 생성 및 관리툴(VARCO-Text) ▲디지털휴먼 생성 및 편집, 운영툴(VARCO-Human)로 나뉜다.

    ‘VARCO Studio’는 VARCO LLM을 기반으로 만든 AI 플랫폼 서비스이다. ‘VARCO Art’는 엔씨 IP에 특화된 웹 기반 이미지 생성 AI 도구로 지난 7월 사내 테스트를 마쳤고, 게임 개발에 실용적으로 활용할 수 있도록 최적화하고 있다. ‘VARCO Text’는 VARCO 언어모델을 기반으로 한 텍스트 생성 및 관리 도구이다. 시나리오, 세계관, 캐릭터 등 게임의 주요한 설정을 쉽게 창작하고 관리할 수 있다. 게임용 텍스트를 넘어 이메일 등의 일반 문서를 작성하는 데까지 활용 범위를 확장할 예정이다. ‘VARCO Human’은 디지털 휴먼의 생성, 편집, 운영을 한꺼번에 관리할 수 있는 통합 툴이다. VARCO 언어모델을 기반으로 생성된 다양한 전문 지식을 탑재해 전문가 페르소나를 만들어 사용할 수 있도록 개발 중이다. 올해 엔씨는 앞서 소개한 생성 AI 서비스 3종 모두를 사내 개발자를 대상으로 정식 론칭할 계획이다.

    엔씨의 언어모델은 게임 콘텐츠 외에도 차량 플랫폼, 교육, 금융, 바이오 등 다양한 분야에 폭넓게 활용할 수 있는 잠재력과 가능성이 있다. 엔씨는 지난 7월 스타트업 드림에이스와 ‘차량용 AI 뉴스 솔루션’ 개발을 위한 업무 협약을 체결했다. 드림에이스-연합뉴스-엔씨 삼자가 협력하여 개발 중인 ‘차량용 AI 뉴스 솔루션’은 AI가 운전자에게 개인화된 뉴스를 실시간으로 제공하는 데 활용된다. 운전자는 운전에 집중하면서 관심 있는 주제의 뉴스를 편하게 제공받을 수 있다. 또한 엔씨는 항공기상청과 협력하며 생성 AI 기술을 활용해 항공 기상 정보를 제작한다. 항공기상청이 공항별로 다양하게 관측하고 예보한 데이터를 공유하면, 엔씨의 언어모델 기반 생성 AI가 사람이 빠르게 이해할 수 있는 쉽고 정확한 문장을 생성한다.

    이 모든 과정에서 엔씨 언어모델의 특수성을 활용하면 특화된 여러 솔루션을 구축하고, 궁극적으로 게임 산업의 혁신적인 기술을 개발하는 데 기여할 수 있을 것이다. 더 나아가 엔씨의 언어모델은 다양한 창작 산업에서 기존의 범용적 창작 AI와는 다른 창작성을 부여할 것이다. 엔씨의 언어모델 혁명은 이제 막 시작되었다.