한국어
    • 한국어
    • ENGLISH
    • 日本語
    • 中文-繁體

    2022.12.15 The Originality

    AI Researcher, Anomaly Detection, 이호엽

    즐겁기 때문에 몰입합니다. 자신만의 방법을 찾아 탁월하게 성취합니다. 나아가 더 큰 탁월함을 위해 치열하게 고민합니다.

    자신을 적극적으로 표현하고, 새로운 경험에 도전하며 성장하는 사람들. 이들은 엔씨에서 좋아하는 일을 펼치며 성장합니다.

    엔씨의 새로운 세대 <THE ORIGINALITY>


    해결하기 어려운 문제를 마주하면 일단 깊이 생각해본다. 고민이 오래 걸린다는 건 내가 그 분야를 잘 모르는 거다. 그럼 문제를 해결할 수 있는 수준까지 가기 위해서 관련 연구들을 찾아보거나, 배경 지식과 내공을 쌓은 뒤 다시 고민한다. 그리고 답을 써 내려간다. 나에게는 이것이 가장 빠르게 성장할 수 있는 방법이었다.

    AI Researcher, Anomaly Detection, 이호엽

    Anomaly Detection, Applied AI Lab

    Applied AI Lab은 미디어나 금융 등 엔씨에서 준비하는 다양한 분야의 신사업에 적용할 수 있는 AI 기술을 연구하는 조직이다. Applied AI Lab 산하의 어노멀리 디텍션 팀은 데이터의 다양한 패턴에서 이상 패턴(Anomaly)을 탐지하고 이를 바탕으로 사용자들에게 의미 있는 정보를 제공하는 것을 목표로 AI를 연구한다.

    최근 학계에서 주목받는 방법론 중 하나는 ‘그래프 뉴럴 네트워크(GNN)’ 기술이다. AI가 이상 패턴을 탐지하기 위해서는 먼저 학습해야 하는데, GNN은 그래프 구조의 데이터를 학습하는 데 효과적인 알고리즘이다. 그래프는 노드(Node) 그리고 노드를 연결하는 엣지(Edge)로 이뤄진다. SNS의 친구 관계나 지하철 노선도를 생각하면 이해하기 쉽다. 그래프는 이미지나 음성과 같이 일상에서 흔한 데이터 형태이자, 복잡한 관계를 나타내기 용이하다. 현재 우리 팀은 GNN을 기반으로 이상 패턴을 정의하고, 연구를 진행하고 있다.

    정상의 두 가지 반대말, ‘비정상’과 ‘정상 아님’

    어노멀리 디텍션에는 크게 두 가지 방법이 있다. 하나는 ‘정상’과 ‘비정상’을 구분하는 것이고, 다른 하나는 ‘정상’과 ‘정상 아님’으로 구분하는 것이다. 똑같은 말처럼 들릴 수도 있겠지만 전자는 ‘정상이다’, ‘비정상이다’ 두 개의 클래스가 있다면 후자는 한 개의 클래스만 사용한다.

    컵을 예시로 들어보자. ‘정상’과 ‘비정상’을 구분하는 방법은 온전한 컵을 정상이라고 인지하고 한쪽이 찌그러진 컵은 비정상이라고 학습시키는 것이다. 반면 ‘정상’과 ‘정상 아님’으로 분류하는 방법은 온전한 컵을 제외한 나머지를 정상이 아닌 것으로 학습시킴으로써 정상이 아닌 상태를 탐지하도록 만드는 것이다.

    ‘정상’과 ‘비정상’을 구분하는 방법은 만약에 컴퓨터가 한쪽이 찌그러진 컵만 비정상으로 학습한다면 얼룩이 묻거나 손잡이가 두 개 달린 컵은 비정상으로 인식하지 못한다는 단점이 있다. 이에 요즘은 정상이냐 아니냐를 구분하는 방법을 중심으로 연구를 진행하고 있다.

    이상에 대비할 수 있도록 알려주는 일

    사람들이 이상 행위를 잘 감지하지 못하고 넘어가는 경우가 생각보다 많다. 특히 우리의 일상에 큰 영향을 미치는 중대한 이상에는 충분한 대비가 필요한데, 이를 탐지하지 못할 경우 속수무책으로 당할 수밖에 없다.

    사람들이 모르고 넘어갈 수 있었던 부분을 꼼꼼히 알려주고, 나아가 충분히 대비할 수 있도록 만드는 것이 우리 팀이 하고 싶은 일이다. 어노멀리 디텍션이 추구하는 가치는 거기에 있다.

    기술의 눈으로 관계를 바라보다

    컴퓨터에게 ‘컵’을 설명하는 방법

    형이 물리학을 좋아했다. 형의 영향을 받아 서로 무관한 것에서 연관성을 발견하거나, 미시적 관계를 분석하여 거시적 현상을 바라보는 일에 흥미를 갖게 됐다.

    AI 기술은 결국 현실에 존재하는 무수히 복잡한 관계성을 인공지능에게 이해시키는 과정이다. 사람은 컵을 보면 이게 컵이구나 하고 자연스레 인지한다. 하지만 컴퓨터가 컵을 인식하는 건 굉장히 어려운 과정이다. 컵을 판별할 수 있는 정보들이 입력되면 ‘이게 컵이구나’ 하는 결론을 출력하기까지 학습 과정을 모델링해야 한다. ‘사람에게는 간단한데 왜 컴퓨터는 복잡하다고 느낄까?’, ‘찌그러진 컵은 정상적이지 않다는 걸 어떻게 설명할 수 있을까?’ 등을 질문하고 연구하는 과정이 재밌었다. 그렇게 AI 연구자의 길을 걷게 됐다.

    무에서 유를 창조하는 인터랙션의 힘

    연구의 본질은 답을 모르는 문제를 해결해가는 것이다. 이때 중요한 것이 ‘인터랙션’이다. 분명히 서로 알고 있는 정보를 나누는데 거기서 새로운 아이디어가 도출되는 것이 인터랙션의 힘이다. 연장선에서 엔씨는 연구자에게 최적의 환경을 갖춘 곳이라 생각한다. 조직문화가 수평적이고 유연하고, 서로의 아이디어를 주고받으며 발전시킬 수 있는 훌륭한 연구자분이 많다. 매일 생산적인 인터랙션이 활발히 일어난다.

    나 또한 팀장으로서 팀원들이 성장할 수 있는 환경을 구축하기 위해 노력한다. 일단 뭐든지 알아야 성장의 단초를 제공할 수 있지 않나. 머신러닝을 비롯하여 최신 기술 논문 등을 꾸준히 공부하려고 노력한다. 또 팀원들과 의견을 나누는 시간을 자주 갖는다. 결과물에 대한 피드백도 주고, 내가 없더라도 팀원들이 자주 티타임을 갖도록 장려하면서 서로 시너지를 내는 기회를 마련하려 한다.

    내 연구가 현실에서 구현된다는 보람

    대학원에 있을 때는 기술을 개발해도 논문 단계에서 끝났기에 막연함을 느꼈다. 내가 연구한 기술이 어떻게 다양한 실제 서비스에 적용될 수 있을지 궁금했다.

    지금 팀에 오기 전에는 뉴스를 클러스터링하는 알고리즘과 사용자들의 선호도를 파악해 추천해주는 알고리즘을 연구했다. 당시 사내에서 추천 알고리즘을 주제로 논문을 발표하고 특허를 냈는데, 얼마 후 다른 조직에서 내 연구를 서비스에 적용하고 싶다는 연락을 주셨다. ‘내가 개발한 기술이 누군가에게는 쓸모 있는 기술이 될 수 있구나’, 연구자로 한 발짝 성장함을 느꼈다.

    당시 연락받은 조직과는 지금도 꾸준히 협업하며 프로젝트를 이어가고 있다. 어노멀리 디텍션 또한 연구의 차원을 넘어 많은 사람에게 유의미한 정보를 전하는 기술로 확장되길 기대한다.

    파인만의 비법, ‘열심히 생각한다’

    재미를 추구하면 성장도 따라오더라

    어떤 일이든지 재미를 추구하는 편이다. 대학에서는 호기심이 많은 학생이었다. 보통 사람들은 학교 게시판을 제대로 안 보고 지나치는 경우가 많은데, 나는 늘 게시판을 들여다보고 관심 가는 공모전이 있으면 참가하거나 흥미로운 주제의 연구가 있으면 지원해보기도 했다.

    엔씨에서도 마찬가지였다. 회사라는 조직의 특성상 재밌는 일만 할 수는 없지 않나. 그럼에도 주어진 일에서 어떻게든 재미를 찾으려 노력했다. 그러다 보면 뭐라도 하나 배우고 얻게 되더라. 결과적으로 나에게는 재미가 성장의 원동력이었던 셈이다.

    문제가 풀릴 때까지 파고든다

    노벨상을 받은 미국 물리학자 리처드 파인만은 문제 해결을 위해 다음의 세 단계를 거쳤다고 한다.1 1번, 문제를 쓴다. 2번, 열심히 생각한다. 3번, 정답을 쓴다.

    문제를 해결하기 위해 ‘일단 해보자’라는 자세를 추구하는 사람들도 있다. 빠르게 착수하고 무수한 시행착오를 통해 답을 찾아가는 과정이다. 하지만 파인만 알고리즘에서는 본격적으로 착수하기 전에 문제를 ‘깊이’ 고민해본다. ‘일단 해보고 안 되면 다시 생각해보자’의 자세는 아니다.

    고민이 오래 걸린다는 건 내가 그 분야를 잘 모른다는 의미다. 그러면 관련 연구를 찾아보거나, 배경 지식과 내공을 쌓은 후 다시 문제를 고민한다. 이러한 과정을 거쳐 나만의 답을 써 내려가는 것, 적어도 나라는 연구자에게는 이것이 가장 빠르게 성장할 수 있는 방법이었다.

    1. 1. 파인만 문제 해결 알고리즘(The Feynman Problem-Solving Algorithm)

    2.    1) Write down the problem.
         2) Think very hard.
         3) Write down the solution.

    이유를 알아야 더 신뢰가 간다

    내년에는 이상 행위를 탐지하는 것에서 나아가 이것이 왜 이상 행위인지 사람들에게 설명할 수 있는 모델을 개발하고 싶다. 단순히 정보만 전달하는 것보다 이 정보가 어떤 알고리즘을 거쳐 도출됐고, 왜 이상 행위로 분류되는지 설명할 수 있을 때 사람들은 그 정보를 보다 신뢰할 수 있을 것이다. 비전공자도 이해할 수 있는 언어로 이상 행위를 탐지하는 과정을 설명해내는 연구자가 되고 싶다.

    * 본 인터뷰에서 언급되는 내용은 인터뷰 당사자의 개인적 견해이며, NCSOFT의 공식 입장이 아님을 밝힙니다.