본문 바로가기
호기심

ChatGPT, 람다, 엑사원 등 AI 모델 비교

by 평사원8 2023. 2. 2.

 

AI란 무엇일까요?

오늘날 AI는 간단한 회의록을 작성하는 것부터 바둑, 자율주행, 챗봇, 자동번역, 글쓰기, 법률자문 등 스스로 딥러닝을 통해 학습하고 추론하고 창작하는 활동을 할 수 있습니다. 인간의 뇌가 정보를 학습하고 기억하는 시냅스를 가진것처럼, 초거대 AI에도 시냅스와 비슷한 파라미터라가 있습니다. 시냅스가 많아지면 빠른 처리가 가능하고 기억하는 용량이 커지듯이 AI에도 파라미터가 많으면 결과값이 훨씬 처리 속도도 빨라지고 정교하고 정확해집니다.

 

 

AI 경쟁 무엇이 중요할까요?

AI 경쟁에서 가장 중요한 핵심은 범용성입니다. 일방적으로 명령해서 단편적인 지식을 학습하는것이 아니라 텍스트↔텍스트만이 아니라 텍스트↔이미지, 영상↔텍스트, 음성↔텍스트, 텍스트↔그림 등 다양한 콘텐츠로 학습이 가능하고 결과값을 보여주어야 합니다. 예를 들어 텍스트만 입력해도 세익스피어처럼 소설을 쓰고 반고흐처럼 그림을 그리는 결과값을 보여주어야 합니다. 그리고 그 결과값은 빠르고 정교하고 인간이 평가하기에 납득이 갈만한 수준이어야 합니다.

최근 ChatGPT에서 말도 안되는 챗봇 서비스를 출시하면서 구글 검색엔진이 사리질지도 모른다는 생각도 듭니다. 700조이상의 시장에서 앞으로 다양한 다국적 대기업들의 AI 경쟁이 일어날 것으로 예측이 됩니다. 그래서 현재까지 출시된 AI 모델을 해외기업과 국내기업으로 비교하여 알려드리고 합니다. 알찬 정보 얻으시고 AI 활용하셔서 투자나 지금 하시는 일에 많은 도움이 되시길 바라겠습니다.

 


<ChatGPT 서비스>
- GPT3.5를 기반으로 개발되었으며 GPT-3 버젼과 다른 점은 사람의 판단까지 합쳐진 대화형 AI 모델입니다. 딥러닝 기술을 활용하여 인간처럼 교감하고 대화하듯 응답을 만들어내고 글쓰기, 번역 등 현존하는 최고의 AI서비스입니다. 미국 변호사, 의사 시험도 합격 가능한 수준이라고 합니다. 최근에는 학교에서 논문이나 시험에 활용되면서 AI도구를 금지한다는 지침이 발표되기도 하였습니다.
- 파라미터수 : 1,750억개

 

챗GPT 시험

 

해외기업 초거대 AI 모델

● GPT-3 (오픈AI)
- 오픈AI사가 개발한 AI 모델이며 시와 소설 작성이 가능하며 셰익스피어 소설을 흉내낸 소설까지 작문하여 많은 사람들을 놀라게 하였습니다. 지금까지 나온 단어를 가지고 다음에 나올 단어를 통계적으로 추론하여 문장을 생성하는 자동 회귀 방식을 사용하고 있습니다. 인터넷에 있는 뛰어난 글들과 위키피디어 데이터 등 다 긁어 모아서 거기서 또 필요한 데이터만 걸러낸 570GB의 알짜배기 데이터로 훈련을 하였습니다. 단점은 스마트폰 자동완성 기능처럼 사용자의 의도를 고려하지 않고 아무말 대잔치를 하는 경우가 있습니다.
- 파라미터 수 : 1750억개

 


● 람다, Lamda(구글)
- 람다는 인터넷 30억개의 문서와 11억개의 대화 등 방대한 데이터로 학습한 대화형 인공지능 모델입니다. 도구(검색, 계산기, 번역)을 이용해 답변 생성이 가능하며 질문용 람다와 답변용 람다를 따로 훈련하였습니다. 일반적인 자동회귀 방식의 학습방법이 아닌 트랜스포머 계열 심층 신경망을 기반으로 대화에 특화된 모델입니다. 추상적으로 대답하지 않고 안전하고 근거있는 답변을 하는 것이 특징입니다.
- 파라미터 수 : 1조6천억개

● 메가트론 튜링, MT-NLG (엔비디아, 마이크로소프트)
- 파라미터가 5,300억개에 달하는 대규모 딥러닝 모델로서 엔비디아의 슈퍼컴퓨터를 사용하여 훈련하였습니다. 텍스트, 코드, 이미지, 비디오, 오디오 등을 생성하는 자율학습 알고리즘 기반입니다.
- 파라미터 수 : 5,300억개(GPT-3 대비 3배 파라미터 보유)

● AI고퍼 (딥마인드)
- 이세돌을 이긴 알파고를 만든 딥마인드에서 개발한 언어 모델이며 150개 이상의 언어 문제를 고퍼와 다른 AI 모델을 비교하였는데 82% 과제에서 훨씬 더 뛰어난 성능을 보여주었다고 합니다.
- 파라미터 수 : 2,800억개

 

 

국내기업 초거대 AI 모델

● 엑사원 (LG)
- 이미지 2억5천만장, 말뭉치 6000억개 이상을 학습하였습니다. 단 몇분만에 반고흐 스타일 그림을 공장에서 찍어내듯이 그림을 그릴 수 있습니다. 텍스트를 입력하고 이미지를 만들고 이미지를 또 텍스트로 변환할 수 있습니다.
- 파라미터 수 : 3,000억개

● 하이퍼클로버 (네이버)
- 우리나라 시장만을 목표로 두고 개발한 AI이고 한글을 가장 잘 이해하는 AI를 만드는게 목표입니다. 한국어 데이터는 GPT-3보다 6,500배 많이 학습하였습니다. 최근에는 클로바 AI 스피커에 특정 주제를 가지고 대화하는 똑똑사전 기능을 출시하였습니다.
- 파라미터 수 : 3,000억개

 

 

삼성 로봇 관련주 및 수혜주 알아보기 (LG 포함)

로봇주 상승 배경 삼성이 로봇 관련주에 본격적으로 투자하기 시작하면서 로봇 관련주에 대한 관심이 높아지고 있습니다. 특히 590억을 투자받은 레인보우로보틱스가 52주 신고가를 경신하며 단

govad.co.kr


● RQ-트랜스포머 (카카오)
- 1400만장의 텍스트와 이미지를 학습하였고 텍스트를 질문하면 이미지로 결과값을 출력할 수 있다. 그러나 이미지를 입력하면 텍스트로 출력할 수는 없다.
- 파라미터 수 :39억개

이상으로 국내외 다양한 초거대 AI모델의 특징과 성능에 대해 비교해보았습니다. 오픈 AI사에서 2030년쯤에 파라미터가 100조개 이상인 GPT-4를 출시할 예정이라고 합니다. 그때쯤이면 정말 AI가 인간의 능력을 뛰어넘어 모든 업무를 처리하는 날이 오지 않을까 생각이 듭니다.


댓글