한국어
    • 한국어
    • ENGLISH
    • 日本語
    • 中文-繁體

    2020.06.12 Science to the Future

    인간과 컴퓨터의 완전한 소통을 꿈꾸는 공학자, 임해창

    영화 〈Her〉에 등장하는 사만다는 인간의 말에 귀를 기울이고, 인간을 이해하고, 경험을 통해 매 순간 진화하는 AI입니다. 상상 속에서 존재했던 이런 AI는 기술의 발전으로 현실에 점점 더 가까워지고 있는데요. 이렇게 인간과 컴퓨터가 자연스럽게 대화할 수 있는 인공지능 구현에는 자연어 처리(NLP) 기술이 핵심적인 역할을 합니다.

    여섯 번째 인터뷰는 고려대학교 컴퓨터학과 임해창 명예교수입니다. 그는 고려대학교 자연어 처리 연구실을 설립했고, 영어를 기반으로 발전한 자연어 처리 기술을 한국어 기반으로 연구한 대한민국 NLP 분야 최고의 권위자입니다.

    그와 함께 인간의 언어 능력을 기술로 구현하는 NLP 분야의 매력에 대해 이야기해봅시다. 그리고 인간에 대한 깊은 이해가 선행되어야 한다는 AI 연구의 미래는 무엇인지 같이 들어봅니다.

    임해창

    고려대학교 컴퓨터학과 명예교수, 엔씨소프트 NLP 센터 자문교수

    University of Texas-Austin에서 컴퓨터 공학으로 학위를 받고 고려대학교 컴퓨터학과의 교수로 부임해 28년간 연구와 인재 육성에 힘썼다. 고려대학교 자연어 처리 연구실을 설립해 한국어 처리와 응용 분야의 연구에 앞장섰으며, IT 기업과 학계에서 NLP 전문가로 활약하고 있는 많은 제자들을 배출했다. 이런 공로를 인정받아 대한민국 NLP 분야 최고 권위자로 불리고 있다. 2018년 정년 퇴임하여 명예교수로 임명되었고, 이후 엔씨소프트 NLP 센터에 자문교수로 합류하여 기술 발전에 도움을 주고 있다.


    인간과 컴퓨터가 소통하기 위한 ‘자연어 처리’

    자연어 처리(NLP: natural language processing)는 무엇을 연구하는 학문인가.

    인간이 일상생활에 사용하는 언어를 우리는 자연어라고 한다. 이와 대비되는 개념으로 컴퓨터는 프로그래밍 언어와 같은 인공어를 사용한다. 서로 다른 언어를 쓰는 인간과 컴퓨터가 소통하려면, 우리가 쓰는 자연어를 컴퓨터 언어의 방식으로 이해시켜야 한다. 즉 자연어 처리는, 자연어를 컴퓨터가 이해하고 처리할 수 있도록 연구하는 학문이다.

    자연어 처리가 실생활에서 어떻게 접목되고 있는지 우리가 공감할 만한 사례가 있을까.

    예를 들면 워드 프로세서를 사용하는 중 철자 오류가 있을 때 교정이 되는 것부터 스마트폰의 ‘시리’나 ‘빅스비’, 최근에 나온 AI 스피커까지 모두 자연어 처리가 되어야 작동이 가능하다.

    AI 스피커는 사람이 하는 말을 알아듣고 대답을 한다. 이렇게 작동하려면 우리가 하는 말을 스피커가 ‘인식’하고 어떤 말을 했는지 ‘이해’하는 과정이 필요하다. 예를 들어, 사용자가 “이번 주말에 볼 만한 영화가 있습니까?”라는 질문을 했을 때 스피커가 그 말에 반응한다면, 이것은 스피커가 단순히 단어의 나열을 ‘인식’한 것으로 본다. 스피커가 질문을 한 사용자의 의도가 무엇인지 파악하고 대답하려면 ‘이해’를 해야만 가능하다. 그리고 스피커는 단순히 박스오피스 1위 영화를 추천하기보다 더 많은 사용자의 정보를 요구한 다음, 사용자에게 개인화된 영화를 추천할 것이다. 이렇게 진보된 인공지능 서비스는 자연어 처리가 우선되어야 한다.

    지금까지 구체적으로 어떤 연구를 해왔는지 소개해 달라.

    자연어 처리 기술은 주로 사용 인구가 많은 영어를 기반으로 발전했다. 이에 고려대학교에 와서 처음 한 일은 한국어 기반의 자연어 처리를 연구한 것이다. 한국어 형태소 분석, 구문 분석, 의미 분석, 대화 분석 등 모든 단계를 한국어로 처리할 수 있도록 노력을 기울였다. 한국어는 하나의 단어에 많은 의미를 내포하기도 하고, 우리 문법의 특성상 영어보다 처리의 어려움이 많았다.

    어떤 어려움이었나.

    자연어의 모호성(Ambiguity) 문제이다. 한국어에 국한된 이야기가 아니라 자연어 처리 연구가 어려운 가장 큰 이유이기도 하다. 동음이의어 표현에 대처가 쉽지 않고 의미적인 또는 구조적인 해석에 따라 중의성 문제도 발생한다. 한국어는 구어와 문어의 차이가 크고, 영어와 달리 청자와 화자의 관계에 따라 높임말과 반말을 사용하기 때문에 대화에서 문맥적인 의미를 이해하는 데 어려움이 많았다.

    그럼에도 자연어 처리 분야는 인공지능 기술 발전에 따라 점점 더 빠르게 진화하고 있다. 앞으로 NLP는 어떤 방향으로 발전할 것이라 보는가.

    미래에는 NLP가 AI를 보다 인간처럼 만들 수 있는 핵심기술이 될 것으로 본다. 정의하기 어렵지만 ‘인공지능을 보다 인간답게 하는 것이 무엇인가?’를 생각해보면, 현재의 인공지능은 아직 인간이 가진 감정을 완전히 이해하지 못하고 있다. NLP 기술은 이런 부분을 보완할 수 있게 한다.

    하나의 예를 들어보자. 엄마가 늦게 귀가한 딸에게 화를 내며 “지금 몇 시인 줄 알아?”라고 말을 했다면, 이것은 시간을 질문한 것이 아니다. 그런데 이 상황에서 기기가 “몇 시입니다”라고 답변을 한다면 곤란하다. 이런 부분을 기기가 제대로 이해하기 위해서는 대화 속에 어떤 감정이 담겨있는지 파악해야 한다.

    이를 위해 텍스트로 되어있는 대화에 억양(Intonation)이나 기쁨, 슬픔 등의 감정을 모두 태깅 한다. 태그를 부착해 이런 감정의 발화에는 이렇게 응답(response)하는 것이 좋겠다는 걸 학습시킨다. 그리고 이런 학습 과정을 통해 유사한 감정이 포함된 질문에 올바른 감정이 반영된 답변을 제시할 수 있도록 시스템을 개발한다.

    NLP는 계속 진화하고 있다. 최근에는 자연어 생성 분야가 각광을 받고 있다. 그림을 보고 시를 생성하거나, 논문을 작성해 주기도 한다. 예를 들면, 그림 다섯 장을 제시하고 서로 연결이 되도록 문장을 생성하는 스토리텔링 연구도 진행하고 있다.

    AI 연구에서 가장 중요한 건 인간에 대한 깊이 있는 이해

    NLP관점에서 인공지능의 궁극적인 목표는 결국 컴퓨터와 인간의 자연스러운 대화일 것이다. 최근 애플의 ‘시리’나 AI 스피커 등의 음성 인식 기반 대화 시스템들은 점점 더 성능이 좋아지고 있지만 아직은 아쉬운 부분들이 많아 보인다.

    우리가 인공지능에 대해 논할 때 가장 많이 언급되는 것이 영화이다. 영화에 등장하는 ‘AI 사만다’는 “당신의 말에 귀 기울이고, 당신을 이해하고, 당신을 아는” 직관적 실체이다. 또 경험을 통해 성장하는 능력이 있고 매 순간 진화하고 있다. 이런 AI가 과연 존재할 수 있을까? 아직은 꿈처럼 느껴진다.

    이를 구현하기 위한 대표적인 연구 분야로는 음성 대화 시스템(Spoken Dialog Systems)이 있다. 이는 자연어 생성과 이해, 대화 관리, 음성 인식과 합성 등의 다양하고 복합적인 기술로 구성되어 기계(AI)가 사람과 음성으로 대화할 수 있도록 하는 시스템이다.

    AI 스피커의 현실을 들여다보면 아직 과제가 많다. 영화와 같은 꿈을 실현시키기 위해서는 많은 언어 자원과 지식 베이스가 구축되어야 한다. 자동 음성인식 성능도 훨씬 향상되어야 하고, 자연어 처리도 견고(Robust) 해져야 한다. 또한 사용자의 말에서 정확한 의도를 파악해 낼 수 있어야 한다.

    무엇보다 가장 중요한 것은 인간에 대한 깊이 있는 탐구다. 인간이 어떻게 대화를 하고, 어떻게 질문을 하고, 어떻게 중의성을 해결하고, 어떻게 배우고 학습하는지. 또 어떻게 감정을 표현하는지에 대한 연구가 되어야만 우리의 꿈과 현실 사이의 간극을 메울 수 있으리라 생각한다.

    AI 분야는 기술적인 발전과 별개로 AI 시대가 가져올 변화에 따른 윤리적인 문제가 지속적으로 제기되고 있다.  

    AI 분야에서 나타날 수 있는 윤리의 문제는 결국 인간의 윤리적인 문제에서 시작된다. 그 부분은 지속적인 교육이 필요하다. 무지의 상태에서는, 이게 문제가 되는지 안되는지 판단할 수 없다. 데이터 조작을 범죄로 인지하지 못하는 경우를 예로 들 수 있다.

    최근 NLP 분야에서의 가장 큰 문제는 ‘가짜 뉴스’이다. 가짜 뉴스를 만들어 확산시킨 사례를 보면 가해자의 악의적인 의도도 있지만 단순히 재미로 가짜 뉴스를 만드는 경우도 있다. 이런 것이 얼마나 나쁜 일이며, 이러한 행동이 다른 사람에게 많은 피해를 줄 수 있는 일임을 끊임없이 교육해야 한다.

    인간을 기술로 구현한다는 것은, 어려운 일이기에 매력적이다.

    NLP분야의 최고 권위자로 불린다. NLP를 전공하게 된 특별한 계기가 있는가.

    최고 권위자라는 명칭을 받기에는 너무나 부족한 사람이라고 생각한다. 초기에는 한국에서 NLP를 연구했던 사람이 많지 않았고, 나는 다른 분야를 기웃거리지 않고 오직 이 분야만 오랫동안 연구했다. 그래서 그런 명칭이 붙지 않았나 생각한다. 지금은 NLP의 인기 여부와 관계없이 이를 하나의 소명으로 여기고 연구를 이어가고 있다.

    NLP는 학부에서 언어학을 전공했기 때문에 선택했다. 그리고, 컴퓨터 공학은 코딩이 재미있어서 시작했는데, 사실 고생을 정말 많이 했다. 컴퓨터 공학에서 요구되는 수학이나 프로그래밍 같은 선수 과목을 모두 이수해야 했기 때문에 학위를 취득하는 데 다른 사람들보다 시간이 많이 걸렸다.

    30년 이상 컴퓨터 분야를 연구했고, 한국의 NLP 연구를 이끌어왔다. 이 분야의 매력은 무엇이라고 생각하는가.

    인간과 같은 언어 능력을 가진 시스템을 만든다는 것은 굉장히 도전적인 목표다. 성취하기 어려운 목표이기에 NLP 연구에 더 매력을 느끼는 것 같다.

    SF 영화에 자주 나오는 로봇은 인간의 명령대로 행동하고, 인간과 대화를 하며, 심지어는 인간을 위로하기도 한다. 이와 같은 능력을 가진 시스템이 꿈이 아니라 현실이 될 수 있는 날을 기대한다.

    컴퓨터 공학을 연구하는 사람들에게 가장 필요한 역량은 무엇인가.

    영어와 수학 능력이다. 다른 학문도 마찬가지이지만 인공지능, 컴퓨터 사이언스 관련 연구나 논문은 모두 영어로 발표된다. 영어를 모르면 새로운 것을 습득하고 적응하는데 늦을 수밖에 없다. 영어는 연구를 하는 모든 사람들에게 필요한 기본적인 역량이고, 수학은 컴퓨터공학의 가장 기본이 되는 학문이다.

    인문학적 역량도 중요하다. 인공지능 기술이 발전하면서 NLP 또한 점점 더 다양한 분야에 접목되고 있다. 만약 심리 상담을 해주는 대화 시스템을 개발한다고 해보자. 그렇다면, 심리학을 모르고서는 제대로 된 것을 만들 수 없다. 결국 인문학적 관심과 역량이 NLP의 활용 가능성을 넓힐 것이다.

    엔씨의 NLP 센터에 대해 어떻게 생각하는가.

    처음 엔씨에 합류한 후 많이 놀랐다. 기술 수준이 아주 높다. 엔씨의 야구 정보 서비스 ‘페이지(PAIGE)’를 보면 정말 많은 NLP 기술이 구현되어 있다. 경기 요약, 기사 생성 등 언뜻 보면 간단한 시스템 같지만 자세히 분석해보면 NLP의 정말 많은 기술들이 녹아 들어가 있다. 그만큼 연구 개발에 많은 공을 들여왔기 때문이라고 생각한다.

    학생들을 사랑하는 교수로 기억되고 싶다

    공학자의 길을 걸으며 가장 어려움을 겪었던 순간이 있었는지.

    대학에서 제자들을 양성하면서 지도한 학생이 학위를 받지 못하고 떠나는 것을 봤을 때 내 탓이 아닐까 하는 속상한 마음이 컸다.

    돌이켜보면 가장 노력했던 부분은 연구실의 대학원생들에게 학비를 지원하는 것이었다. 학생이 많으면 많을수록 프로젝트도 그만큼 많이 진행해야 했다. 지금은 NLP가 인기가 많아 비전공 교수들도 전공하고 싶은 분야가 되었지만 재직 당시에는 프로젝트 수의 절대량이 부족해 프로젝트를 따는 것이 쉽지 않았다. 그래도 학생 모두의 학비를 지원할 만큼의 프로젝트를 하려고 노력했다.

    학생 입장에서는 한두 개 프로젝트에 참여하는 것이었겠지만, 교수 입장에서는 모든 프로젝트에 다 관여해야 했기에 벅찰 때도 있었다. 그래도 다행히 학생들은 이 부분을 참 고마워했다. 논문 쓰는데 더 많은 도움을 줬어야 했는데 학비 지원을 위해 열과 성을 더 쏟지 않았나 하는 아쉬운 마음이 있다.

    아직 이루지 못한 꿈이 있다면 무엇인지.

    사람과 사람이 자연스럽게 대화를 하듯이, 컴퓨터와 대화할 수 있는 시스템을 만드는 것이 꿈이다. 아직 갈 길은 멀지만 앞으로 엔씨 NLP 센터의 연구를 지켜보면서 후배들이 가는 길을 돕고 싶다. 개인적으로는 한국어 교원 2급 자격증을 취득하기 위해 공부하고 있다. 공부를 하다보니, 아직도 언어에 대해 모르는 부분이 많다는 걸 느낀다. 자격증을 따면 우리나라에 있는 외국인들에게 봉사하면서 내가 받은 은혜를 갚으며 살 것이다.

    어떤 사람으로 기억되고 싶은가.

    사람들에게는 NLP를 열심히 했던 교수로 그리고 학생들을 사랑하는 교수, 이렇게 기억되고 싶다.

    * 본 인터뷰에서 언급되는 내용은 인터뷰 당사자의 개인적 견해이며, NCSOFT의 공식 입장이 아님을 밝힙니다.