기존 AI를 넘어선 초거대 AI, 국내·글로벌 기업들의 개발 경쟁

지금 인류는 인공지능(AI)의 시대에 살고 있다. 자율주행차, AI 면접, AI 의료 서비스 등 다양한 분야에서 상용화되어 우리의 일상에 녹아있다. 하지만 지금의 AI는 많은 한계가 있고, 사용자와의 의사소통에 있어 매끄럽고 전문적이지는 않다.

이런 배경 속에서 '초거대 AI'를 개발하려는 움직임이 글로벌 기업 뿐만 아니라 국내 기업에서도 활발히 일어나고 있다.

초거대 AI는 대용량의 데이터를 AI가 스스로 학습해 실제 인간처럼 종합적인 추론을 할 수 있는 차세대 AI다. 현재 우리가 사용하고 있는 AI보다 훨씬 많은 양의 데이터로 딥러닝을 진행하여 이를 활용한 서비스 영역 확장과 품질 향상에 용이하다. AI의 성능을 가늠할 수 있는 척도인 '파라미터(변수)'가 기존의 AI보다 최소 수백 배 이상은 많다. 파라미터는 우리 뇌에서 뉴런 간 정보 전달 통로의 역할을 하는 시냅스와 비슷한 역할을 하는 개념이다.

초거대 AI를 활용하면 더 다양한 비즈니스 모델이 등장할 수 있기에, 업계는 초거대 AI에 막대한 투자를 하고 있다. 2020년 일론 머스크 테슬라 창업자가 세운 오픈AI에서 선보인 GPT-3가 대표적이다. 국내 기업에서는 네이버의 하이퍼클로바, 카카오브레인의 KoGPT, LG그룹의 엑사원 등이 있다. 우리가 영화 「아이언맨」에서 본 인공지능 집사 '자비스'가 바로 초거대 AI의 현실화한 버전이다.

일론 머스크(테슬라 창업자·CEO)가 설립한 AI 연구기관인 오픈 AI에서 발표한 AI 언어모델인 'GPT-3'

▶초거대 AI 개발의 서막

일론 머스크 테슬라 창업자가 설립한 AI 연구기관인 오픈 AI에서 2020년 초거대 AI 언어모델인 'GPT-3'를 발표하며 초거대 AI 시대의 막이 열렸다. GPT-3는 1,750억 개의 파라미터를 갖춰, 이전 버전인 GPT-2(15억 개)보다 약 117배나 많다. 기존 AI가 특정 주제나 키워드에 정해진 답변만 했다면, GPT-3는 파라미터의 규모가 비약적으로 커진 만큼 어떤 질문에도 문장을 직접 생성해 답변할 수 있게 되었다. 장문의 글을 요약하는 능력도 탁월해졌지만, 일상 언어를 컴퓨터 프로그래밍 언어로 번역해 애플리케이션 개발을 위한 코딩까지 하게 되었다. 주요 외신들은 "GPT-3 기반의 초거대 AI는 사람 수준의 작업이 가능하므로 업무 생산성이 크게 향상될 것"이라고 평가했다.

하지만 GPT-3의 문제는 언어별 학습 데이터 비중에서 영어가 92.7%로 압도적으로 높아 영어 전용 모델에 가깝다는 것이다. 이에 네이버는 2020년 5월, 한국어 초거대 AI 언어 모델인 '하이퍼클로바'를 내놓았다. 하이퍼클로바는 GPT-3를 능가하는 2,040억 개의 파라미터를 갖춰 GPT-3보다 한국어 데이터를 약 6,500배 이상 학습했다. 정석근 클로바 CIC 대표는 "글로벌 기업의 플랫폼에 종속되지 않으려면 공개된 기술을 활용하고 따라잡는 수준에 그쳐서는 안 된다"며 "한국어 AI 서비스를 제대로 하려면 한국어에 맞는 초거대 언어 모델을 확보하는 것이 중요하다"고 전했다.

▶네이버 '하이퍼클로바'의 활용

자연어 이해는 컴퓨터가 인간의 언어를 이해하도록 만드는 영역이다. 초거대 AI는 현재 이 자연어 처리 분야에서 주로 활용되고 있다. 네이버의 하이퍼클로바는 향후 이미지와 영상까지도 이해하고 해석할 수 있도록 발전시킬 계획이지만 현재는 자연어 처리에 집중하고 있다.

하이퍼클로바의 자연어 처리 활용 분야는 무궁무진하다. 하이퍼클로바는 인간이 처리하기 힘든 수천, 수만 건의 쇼핑몰 리뷰를 한 문장으로 요약할 수도 있다. AI가 한 상품에 대한 리뷰들을 주제별로 묶고, 각 묶음에서 주요 단어와 문장을 선정해 한 문장으로 만들어낸다.

예를 들어 의류 쇼핑몰의 리뷰에서 '디자인이 예뻐요', '사진보다 색감이 진해요', '너무 마음에 들고 배송이 빨라요' 등의 수천 가지의 리뷰를 단 몇 초 만에 '디자인이 예쁘고 사진보다 색감이 선명해서 마음에 들어요. 또 배송도 빨라요'라는 문장으로 요약해준다. 이에 네이버 관계자는 "하이퍼클로바를 적용한 리뷰 요약 문장은 기존 AI보다 문법이 잘 맞고 매끄럽다"고 강조했다.

네이버는 사용자가 네이버 검색창에서 검색한 내용에 오타나 띄어쓰기가 잘 안 되어 있고 완벽한 문장이 아니더라도 하이퍼클로바를 이용하여 정확한 검색을 도와주는 기능을 적용했다. '아래베가 아플때 먹는ㅇ'이라고 잘못 입력해도 AI가 사용자의 과거 검색 이력 등을 바탕으로 '아랫배가 아플 때 먹는 약'이라고 정확히 검색할 수 있도록 해준다.

조너선 셰퍼 캐나다 앨버타대 석좌교수는 "초거대 AI를 적용한 어시스턴트, 챗봇, 고객센터 서비스가 본격적으로 등장하면 사람들은 AI의 능력에 대해 또 한 번 충격을 받을 것"이라며 "AI가 인간과 의미 있는 대화를 나누는 시대가 열린다고 보면 된다"고 말했다.

초거대 AI를 적용한 SKT의 개인 맞춤형 AI인 '에이닷'. 사진 제공=SK텔레콤

▶초거대 AI 개발에 뛰어든 통신 3사

네이버뿐만 아니라 국내 통신 3사도 초거대 AI 개발에 열을 올리고 있다. 초거대 AI를 활용하면 각 통신사에서 보유한 대규모 데이터를 활용해 사업 영역 확장에 용이하기 때문이다. 또 AI컨택센터(AICC)의 업무 효율 향상도 가능하다.

업계에 따르면 SKT는 개인 맞춤형 AI인 '에이닷'에 초거대 AI를 적용했다고 한다. KT는 초거대 AI를 활용하여 서비스 품질을 높일 계획이고, LG유플러스도 AICC에 초거대 AI를 도입하는 방안을 논의 중이다.

최근 SKT는 에이닷 오픈베타 서비스를 시작했다. GPT-3를 기반으로 제작된 에이닷은 소비자와 매끄러운 대화가 가능한 것이 가장 큰 특징이다. 에이닷은 소비자와의 과거 대화 내용을 토대로 개인별 취향을 파악한 뒤 이에 맞는 콘텐츠를 추천해준다. 관심 기업의 주가나 시가총액, 운세와 날씨 같은 정보를 알려주는 것은 물론 OTT(Over The Top, 인터넷으로 영화나 드라마 등 미디어 콘텐츠를 제공하는 서비스)와도 연계하여 사용할 수 있다.

SKT는 앞으로 다른 사업자들에게도 에이닷을 오픈해 생태계를 넓힐 것이라고 밝혔다. 우선 에이닷을 기반으로 서비스를 고도화한 후 다른 영역까지 확장할 계획이다. 이에 SKT 관계자는 "소비자의 다양한 피드백을 받아서 일단 에이닷을 고도화하는 방향이 될 것으로 보인다"며 "AICC 등 다른 서비스 적용에 대해서는 추후 논의할 예정"이라고 전했다.

KT는 AI 활용과 공동연구를 위한 산학연 협의체인 'AI원팀'에서 다자간 공동연구를 통해 초거대 AI 모델을 개발 중이다. AI원팀에 따르면 올해 안으로 초거대 AI 모델을 상용화하고, 이를 기반으로 KT의 전반적인 AI 서비스 지능을 진화시킨다고 한다.

KT의 초거대 AI 언어모델은 즉시 상용화가 가능하도록 설계된다. 음성인식(STT), 대화, 음성합성(TTS), 텍스트 분석(TA) 등의 기술을 KT 기가지니와 AICC 서비스 고도화를 위해 먼저 사용한다. 음성을 텍스트로 변환해주는 하이브리드 STT 기술이 적용된 '지니 딕테이션' 서비스를 'AI 통화비서' 서비스에 이미 적용했다.

KT는 초거대 AI의 학습 데이터 필터링을 강화하여 AI의 데이터 편향성을 제거하는 방향으로 초거대 AI를 설계하고 있다. AI의 데이터 편향성은 AI 채용, AI 판사의 활용 사례에서 윤리적 문제가 생긴 사례가 있다. 이력서에 여성 관련 내용이 있거나 여성 지원자라는 이유로 불합격시키거나, 흑인의 재범률을 백인보다 2배 이상 높을 것으로 판단하는 등의 성·인종 차별성 이슈가 있었다. KT는 이러한 문제를 방지하기 위해 편향성 제거를 포함한 유해 콘텐츠 필터링 기술 등 다양한 딥러닝 기반 탐지 기술을 적극 활용할 계획이다.

또 초거대 AI를 KT 기가지니에 적용해 감성을 더할 예정이다. 감성을 지닌 초거대 AI를 KT 기가지니에 활용하면 사용자의 감성분석 등을 통해 사람처럼 대화가 가능할 것으로 예상한다. KT 관계자는 "이를 토대로 전문 영역에서의 상담, 요약, 설명이 가능한 AI로 발전할 수 있을 것"이라고 전망했다.

LG유플러스는 LG그룹에서 개발한 초거대 AI 모델인 '엑사원'을 LG유플러스의 다양한 AI 서비스에 접목할 계획이다. LG AI연구원에 따르면 엑사원은 자체 개발한 알고리즘을 기반으로 언어를 이미지로, 이미지를 언어로 변환하는 기술을 구현했다고 한다. 특히 LG전자와 LG화학, LG유플러스, LG CNS 등 LG 계열사들이 보유한 전문 데이터를 포함해 다양한 분야의 데이터를 학습했다고 전했다.

LG유플러스는 내년 하반기까지 엑사원을 기반으로 AICC를 향상하는 것을 목표로 정했다. 오는 8월, 소상공인 맞춤형 AI 콜봇 서비스인 'AI 가게 매니저'를 출시할 예정이다. 또 3분기에는 LG유플러스 고객센터에 AI 콜봇을 상용화하고, 자체 STT와 TTS 엔진을 출시할 계획이다. 이를 토대로 간단한 상담 업무는 AI가 담당하고 상담원들은 보다 복잡하고 까다로운 업무에 집중할 수 있을 것으로 보인다.

▶글로벌 기업들의 초거대 AI 개발 경쟁

국내에서는 초거대 AI가 최근 들어 핵심 키워드로 떠올랐지만, 글로벌 빅테크 기업들은 이미 GPT-3 등을 활용한 초거대 AI 서비스 상용화를 시작했다. GPT-3 기반의 AI 애플리케이션만 벌써 300개가 넘은 것으로 알려졌다.

미국과 중국을 중심으로 GPT-3를 능가하는 초거대 AI 개발 경쟁이 치열하다. 구글은 2020년 2월, 파라미터 수가 최대 1조 6,000억 개에 달하는 초거대 AI인 '스위치 트랜스포머(Switch Transformer)'를 내놨다. 이에 맞서 4개월 뒤인 6월에는 중국 정부의 지원을 받는 베이징 지위안 인공지능 연구원(The Beijing Academy of Artificial Intelligence, BAAI)은 파라미터 수가 무려 1조 7,500억 개에 달하는 '우다오(WuDao) 2.0'을 공개했다.

우다오 2.0은 중국 전통 문체를 활용한 시를 창작할 수도 있고, 이미지 생성과 인식 능력이 뛰어난 것으로 알려졌다. 홍콩 사우스차이나모닝포스트(SCMP)는 "우다오 2.0은 미국 오픈 AI와 구글을 뛰어넘는 수준"이라며 "미·중 기술 패권 전쟁이 초거대 AI 분야로 확전되고 있는 양상"이라고 말했다. 미국 오픈 AI는 2020년 1월 GPT-3를 활용해 일상 언어를 입력하면 이미지를 생산하는 AI 기술을 선보였다. 2030년쯤에는 파라미터의 수가 100조 개에 달하는 GPT-4를 공개할 예정이다.

IT업계 관계자는 "기업이 초거대 AI에 주목하는 가장 큰 이유는 개발 과정에서 다양한 신기술과 혁신 서비스가 탄생할 수 있기 때문"이라며 "반대로 초거대 AI를 포기하면 이런 혁신 기회를 놓치고 글로벌 AI 경쟁에서 뒤쳐질 수밖에 없다"고 전했다.

염도영 기자 doyoung0311@chosun.com

다른기사 보기

개의 댓글

BEST댓글

BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.

댓글삭제

삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?

댓글수정

댓글 수정은 작성 후 1분내에만 가능합니다.

내 댓글 모음

생성형 AI 등장, 기업은 업무 효율을 기대했다

KT, ‘Responsible AI Center’ 설립으로 책임감 있는 AI 속도

마키나락스, 과학·정보통신의 날 국무총리 표창

딥노이드, ‘딥뉴로’ 의료기관서 비급여 청구 시작

카카오헬스케어-아워홈, 개인 맞춤형 건강 시대 연다

아카에이아이, 충남 합도초에 AI 학습 로봇 도입

올거나이즈, 알리 LLM 앱 보안 강화

세일즈포스 “지구 희생하며 AI 사용할 수 없다”

기존 AI를 넘어선 초거대 AI, 국내·글로벌 기업들의 개발 경쟁