최종편집:2024-03-28 23:03 (목)
실시간
대한민국 초거대 AI의 맏형 ‘하이퍼클로바 개발기’

대한민국 초거대 AI의 맏형 ‘하이퍼클로바 개발기’

  • 기자명 박설민 기자
  • 입력 2022.09.29 17:50
  • 수정 2023.03.29 14:33
  • 0
  • 본문 글씨 키우기
이 기사를 공유합니다

[AWC 2022 in Busan] 하정우 네이버 AI랩 연구소장 “50년 치 한국어 데이터 학습”

29일 부산 벡스코에서 개최된 ‘AWC 2022 in Busan(AWC 부산)’에서 발표하는 하정우 네이버 AI랩 연구소장/ THE AI

최근 인공지능(AI) 분야 최대 화두는 ‘초거대 AI’다. 대용량 데이터를 스스로 학습해 인간처럼 종합 추론이 가능한 ‘초거대AI’는 모든 산업 분야에서 무궁무진한 활용이 가능하다. 국내 기업들 역시 초거대 AI 개발을 위해 발 빠르게 움직이고 있다.

그중 대표적인 것은 네이버에서 개발한 ‘하이퍼클로바(HyperCLOVA)’다. 국내서 가장 먼저 나온 ‘초거대AI 선배’인 하이퍼클로바는 국내 AI기업들이 나아갈 길을 제시하는 ‘이정표’같은 존재다. 29일 부산 벡스코에서 개최된 ‘AWC 2022 in Busan(AWC 부산)’에서 하정우 네이버 AI랩 연구소장은 이 하이퍼클로바가 개발된 과정과 앞으로 변화할 미래에 대해 이야기했다.

하 소장의 설명에 따르면 하이퍼클로버의 핵심이 된 기술은 ‘트랜스포머(Transformer)’ 모델이다. 이는 문장 속 단어들끼리의 관계를 추적해 맥락과 의미를 학습하는 AI신경망 기술이다. 스스로 중요한 정보를 찾아낼 수 있을 뿐만 아니라 병렬학습 능력도 최적화돼, GPT-3, PaLM같은 초거대 AI에도 적용된 기술이다. 

트랜스포머 모델로 AI를 학습시키는 방법은 다음과 같다. 예를 들어 어떤 단어를 가린 문장을 제시하고, 그 곳에 들어갈 단어를 AI가 추론하도록 시키는 것이다. 이미지 같은 경우엔 2장의 이미지를 주고, 차이점과 공통점을 찾도록 만든다. 즉, 문제의 답을 AI가 스스로 찾도록 만드는 것이 이 트랜스포머 모델이라고 볼 수 있다. 

하 소장은 “과거엔 AI학습 모델 개발에 다양한 방법이 제시됐으나, 초거대 AI측면에서는 트랜스포머 멀티모달이 가장 우수하다”며 “굉장히 많은 데이터들을 AI에게 가르칠 수 있게 됐다”고 말했다.

하이퍼클로바의 또 다른 특징은 ‘한국어 전문’ 초거대 AI라는 점이다. 미국 AI연구소 오픈AI가 개발한 ‘GPT-3’와 달리, 대규모 한국어 데이터를 학습했다. 이는 GPT-3의 약 6500배 수준이다. GPT-3가 학습한 언어 중 영어가 93%를 차지한다면, 하이퍼클로바에서는 학습 언어 97%가 한국어다. 때문에 국내 이용자들이 사용하기에 가장 최적화된 초거대 AI모델이라고 볼 수 있다.

이렇게 만들어진 하이퍼 클로바는 현재 ‘클로바 노트’ 등의 서비스에 이용되고 있다. 클로바노트는 음성을 문자로 기록해주는 AI 서비스다. 약 1000개 이상의 그래픽 처리 장치(GPU)를 기반으로 한 하이퍼클로바의 연산 능력으로 뉴스 영상 등 50년 치의 각종 한국어 데이터를 학습해 기존 AI 음성변환 서비스들보다 30% 이상 정확도를 높였다.

하 소장은 “하이퍼클로바는 현재 네이버와 파트너십을 맺은 기업들이 활용할 수 있도록 제공하고 있다”며 “네이버 자체에서도 많은 AI 서비스를 개발할 때 하이퍼클로바를 이용하고 있다”고 말했다.

이어 “특히 클로바 노트는 강의, 미팅 등에 특화돼 많은 사랑을 받고 있는 서비스”라며 “이 외에도 텍스트만 입력하면 이를 음성으로 변환해주는 ‘클로바 더빙’ 서비스도 하이퍼클로바를 기반으로 제작해 서비스 중이다”라고 말했다.

다만 하 소장은 하이퍼클로바를 비롯한 트랜스포머 기반의 AI가 가진 문제점에 대해서도 지적했다. 개발기간이 기존 AI모델보다 길고, 데이터 가공 작업이 복잡해졌다는 것이다. 이 때문에 비용도 많이들 뿐만 아니라 재학습, 평가, 모니터링 등 지속적 관리도 필요해졌다.

하 소장은 “트랜스포머 모델로 학습시킨 초거대 AI는 사람이 정답을 일일이 학습시키는 모델보다 훨씬 더 똑똑한 모델을 만드는 것이 가능하지만, 많은 양의 데이터를 사용해야 한다는 부담이 있다”며 “이때 관리 및 데이터 가공 비용 등이 훨씬 더 많이 드는 것은 해결해야할 문제점”이라고 말했다.

이어 “네이버에서는 이런 하이퍼클로바의 문제들을 해결하기 위해, KAIST, 서울대 등과 협업해 연구를 진행하고 있다”며 “궁극적으로는 하나의 초거대 AI모델을 많은 연구기관, 기업들이 함께 사용하면서 문제점을 찾아내고, 성능을 높이는 새로운 생태계를 만들게 될 것”이라고 전했다.

 

.

저작권자 © THE AI 무단전재 및 재배포 금지
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
모바일버전