한국어
    • 한국어
    • ENGLISH
    • 日本語
    • 中文-繁體

    2022.09.30 ESG

    [NC] AI Ethics Framework | Transparency

    엔씨는 세상 모두가 즐거움으로 연결되는 미래를 꿈꿉니다. 그 미래에는 올바른 즐거움을 위해 안전하면서도 투명하고 편견 없는 기술 윤리를 실천하는 것도 포함되어 있습니다. 이를 위해 엔씨는 인공지능 기술 개발의 중요성과 윤리적 책임을 깊이 인식하고 적극적으로 기술 경영을 하고 있는데요. 특히 AI 기술이 ‘인간 중심의 AI’로 지속 성장하기 위한 가이드라인이 될 [NC] AI Ethics Framework 원칙을 제정하였습니다.

    [NC] AI Ethics Framework의 핵심 가치 3가지는 Data Privacy, Unbiased, Transparency입니다. 엔씨는 AI 기술 개발 과정에서 사용자의 데이터를 보호하고 사회적으로 편향되지 않도록 주의하며, 해석 가능한 AI를 지향하고 있습니다. 더불어 AI 윤리에 대한 사회적 인식이 확산하도록 세계적 석학과의 대담, 외부 공동 연구 및 연구 후원 등의 활동도 진행하고 있습니다. 이번 기사에서는 엔씨가 Transparency를 핵심 가치로 선정한 이유와 실천하고 있는 활동을 소개하겠습니다.


    투명성을 추구하는 AI

    최근 AI 기술이 기업의 입사 면접에도 많이 쓰이고 있다. 그런데 지원자 입장에서는 AI가 자신의 답변 내용보다는 시선 처리나 발성 등의 행동에만 치우쳐서 평가하는 것 아니냐는 의문을 품을 수 있다. 이 같은 현상의 근본적 이유는 흔히 ‘블랙박스’라고 불리는 AI의 작동 방식 때문이다. 즉, AI 모델이 어떤 데이터 특성으로 훈련되었는지 설명할 수는 있어도 사용자 입장에서는 *‘Ground-truth’를 전혀 확보하지 못하도록 만든다는 것이다.

    엔씨가 추구하는 AI 기술은 이해하기 쉽고 의사 결정 과정과 결과를 설명할 수 있어야 한다. 이를 위해 엔씨는 AI 시스템의 설명 가능성을 높이고, 작동 원리에 관한 논문 및 주요 기술을 공개하는 등 기술 공유를 위해 적극 노력하고 있다.

    *Ground-truth: 머신러닝 모델에서 대상이 되는 문제의 실제 특성(the actual nature)

    1. AI 모델 작동 원리 및 주요 기술 공개

    엔씨는 AI 관련 정보와 기술을 공유할 뿐만 아니라 AI의 의사 결정 과정과 결과에 대한 설명력과 사용자의 이해도를 높이는 데도 기여하고 있다. 2021년에는 10개 이상의 AI 연구 논문과 오픈소스 코드를 공개하고, 이를 통해 사용자가 AI 모델의 의사 결정 과정을 보다 쉽게 이해할 수 있도록 했다.

    특히 엔씨 NLP 센터는 진행 중인 연구들을 체험할 수 있도록 NLP Hub(https://nlphub.ncsoft.com)를 예전부터 운영하고 있지만 모든 기술을 공개하지는 못했다. 하지만 앞으로 내부에서 진행하고 있는 연구들 중 공개 가능한 연구와 데이터들을 보다 많은 사람이 보고 쓸 수 있도록 차례차례 오픈할 예정이다. 사용자들이 모일 수 있는 플랫폼도 만들 예정이다. 아래는 엔씨가 공개한 AI 모델의 사례다.

    Multi-Agent Reinforcement Learning Invades MMORPG: ‘Lineage Clone Wars’ (GDC 2022) 강화학습 기반 AI를 적용한 리니지 ‘거울전쟁’과 ‘전설 vs 현역’ 콘텐츠 사례 소개

    자기 자신과 전투하며 학습하는 ‘Self-Play Learning’ 기술을 도입했다. 다양한 변수에 유연하게 대응할 수 있는 AI가 탄생하여 수십 명 단위로 전투를 수행할 수 있으며, 상용화 수준까지 구현할 수 있는 세계 최초의 사례(세계 최초, 강화학습 AI 기술 기반 새로운 MMORPG 콘텐츠를 제시하다)

    “Adversarial Multi-Task Learning for Disentangling Timbre and Pitch in Singing Voice Synthesis”, Interspeech 2022. 파라메트릭 보코더의 음색과 피치를 나타내는 음성 특징과 뉴럴 보코더의 멜-스펙트로그램을 함께 학습하여 음색 표현과 피치 표현을 분리 모델링하는 합성 모델 개발

    가사와 노트 정보를 함께 모델링하며 음색과 피치를 분리하기 위해 적대적 다중 작업 학습 방법을 제안하여 연구를 진행했다. 결과적으로 멜-스펙트로그램뿐 아니라 보조적 특징인 음색과 피치 특징도 GAN 학습을 통해 예측도를 높여 멜-스펙트로그램의 예측 성능도 함께 향상하여 더욱 자연스러운 가창 음성 합성은 물론 여러 가수의 가창 음성을 하나의 모델로 생성할 수 있게 되었다. (2022 Interspeech 게재 논문 3편 소개)

    2. 해석과 설명 가능한 AI 대화 데이터셋 공개

    엔씨는 해석과 설명이 가능한 AI 대화 데이터셋 ‘FoCus Dataset(For Customized conversation dataset)’도 공개했다. 사용자는 FoCus Dataset을 통해 AI가 학습한 데이터의 출처, 그 데이터를 수집하고 처리한 방식에 관한 정보를 알 수 있다. 이를 통해 사용자는 AI 의사 결정의 출처를 확인하고, 나아가 AI 모델을 더 잘 이해할 수 있을 것이다.

    이 데이터셋의 장점은 초거대 언어 모델을 사용하지 않고도 성능이 같은 대화 기술을 구현할 수 있다는 것이다. 초거대 모델은 엄청난 수의 파라미터와 강력한 학습 성능, 방대한 학습 데이터가 필요하다. 그만큼 데이터를 수집하는 데 많은 노력이 필요하고, 1회 학습하는 데 수십억~수백억 원의 비용이 소요되므로 이 조건들을 감당할 수 있는 큰 회사만 활용할 수 있다. 그에 비해 작은 회사는 데이터 수집이나 학습 비용을 감당할 수 없기 때문에 연구 격차가 더 벌어질 수밖에 없다. 그런데 초거대 언어 모델을 사용하지 않고도 성능이 같은 대화 기술을 구현할 수 있다면 비용과 데이터 수집에 필요한 노력을 줄일 수 있다.

    FoCus Dataset은 엔씨와 고려대의 공동 연구로 구축되었다. 2022년 2월 공동 연구팀은 세계 최고 권위의 인공지능학회 **AAAI 2022에 해당 논문을 게재 및 발표했고, 지금은 연구 성과를 발표하는 워크숍과 셰어 태스크(Shared Task)를 운영하고 있다. 그리고 10월 경주에서 관련 주제로 열리는 ***COLING 2022에도 초청되어 강연과 논문 발표를 진행할 예정이다. 아직까지는 상용화된 서비스에 직접 적용하지 않았지만, 데이터를 오픈하기 전에 내부에서 비윤리적 표현과 개인정보들을 모두 제거했기 때문에 안전하게 사용할 수 있다는 점에서 선구적인 데이터다. 엔씨는 비용 및 환경 문제 때문에 NLP 학계에서 새로운 대화 기술들이 제안되고 있는 흐름에 발맞추어 이 데이터를 공개했다. 앞으로도 엔씨는 연구 커뮤니티의 활발한 논의와 기술 개발에 적극적으로 참여하고자 한다.

    **AAAI(Association for the Advancement of Artificial Intelligence): 전미인공지능학회

    ***COLING 2022(the International Conference on Computational Linguistics): 전산 언어학에 관한 국제회의

    3. AI 행동 패턴 분석 시스템 구축

    엔씨는 설계 의도에 맞는 AI 시스템의 행동 판단과 패턴 분석을 위한 AI 로그 분석 및 시각화 툴을 구축하고 있다. 덕분에 AI 시스템의 행동과 판단을 설명하고 해석할 수 있게 되었다. 더 자세하게 설명하면, AI 행동 패턴을 추상화한 그래프로 시각화하여 쉽게 분석할 수 있다. 또한 특정 행동이 의도적인지 아니면 우연이나 버그 때문에 발생했는지 확인할 수 있도록 의사 결정 추론 과정의 중간 결과도 저장하고 시각적으로 확인할 수 있다. 이를 통해 AI가 이상 행동을 하게 된 과정을 보다 자세히 확인하고 대응할 수 있다.

    AI 행동 패턴 분석 비주얼라이제이션 툴

    믿고 안심할 수 있는 AI를 위해

    AI가 ‘이해할 수 없는 불안한 존재’라는 인식을 줄이기 위해서는 AI의 투명성이 높아져야 한다. AI가 문제를 일으킬 수 있는데 그 과정을 알 수 없어서 해결하기가 어렵다면 AI를 우리의 삶에서 안심하고 활용할 수 없을 것이다. 엔씨는 ‘윤리적’이란 가치를 ‘사람이 안심할 수 있는 것’을 포함하는 개념으로 본다. 그 관점에서 ‘투명성’은 ‘사람이 안심할 수 있도록’ 하기 위한 중요한 수단이다. 특히 투명성을 위해 AI 행동을 분석하는 도구는 AI의 행동으로 인해 생기는 사용자의 불만 사항을 확인하고 원인을 찾기 위한 것이다. AI로 인한 피해를 방지한다는 점에서 AI 행동 분석 도구를 개발하고 향상하는 것은 넓은 의미에서 윤리적 활동이라고 할 수 있다. 그 과정에서 AI 개발 과정의 문제를 해결하는 데도 도움이 되므로 일석이조의 효과도 얻을 수 있다. 엔씨는 우리가 안심하고 삶에서 AI를 활용할 수 있도록 AI의 투명성을 높이는 수단을 공고히 마련하는 데 최선의 노력을 다할 것이다.