LG, 멀티모달AI 엑사원 4.5 공개..."코딩 성능, 젬마4 넘어"

김나윤 기자 / 기사승인 : 2026-04-09 11:45:42
  • -
  • +
  • 인쇄
▲엑사원 4.5와 엑사원 4.0 비교 (자료=LG)

LG AI연구원이 9일 텍스트와 이미지를 동시에 이해하고 추론하는 멀티모달 AI 모델 '엑사원(EXAONE) 4.5'를 공개했다.

엑사원 4.5는 LG AI연구원이 2021년 12월 국내 최초 멀티모달 AI 모델 '엑사원 1.0'을 개발하며 축적한 기술력을 바탕으로, 자체 개발한 비전 인코더와 거대언어모델(LLM)을 하나의 구조로 통합한 비전-언어 모델(VLM)이다.

이번 모델은 독자 AI 파운데이션 모델 프로젝트에 개발 중인 'K-엑사원'의 모달리티 확장을 위한 준비 단계로 계약서, 기술 도면, 재무제표, 스캔 문서 등 산업 현장에서 실제로 다루는 복합 문서를 정확하게 읽고 추론하는 능력에 강점이 있다.

테스트 결과 STEM(과학·기술·공학·수학) 성능을 측정하는 5개 지표 평균 77.3점을 기록해 미국 오픈AI 지피티(GPT)5-mini(73.5점), 앤트로픽 클로드 소넷(Claude Sonnet) 4.5(74.6점), 중국 알리바바 큐웬(Qwen)3 235B(77.0점)를 모두 앞섰다.

일반 시각 이해를 측정하는 3개 지표와, 이미지와 텍스트가 결합된 인포그래픽을 비롯해 전문 문헌 속 복합 정보를 읽어내는 문서 이해 및 추론 성능 평가 지표 5개를 포함한 13개 지표 평균 점수에서도 지피티(GPT)5-mini와 클로드 소넷(Claude Sonnet) 4.5, 큐웬(Qwen)3-VL을 상회했다.

특히 코딩 성능 대표 지표인 라이브코드벤치(LiveCodeBench) v6에서는 81.4점으로 구글의 최신 모델 젬마(Gemma) 4(80.0점)를 넘었으며, 복잡한 차트를 분석하고 추론하는 능력을 평가하는 ChartQA Pro에서는 62.2점으로 동급 모델과의 비교에서 글로벌 경쟁력을 입증했다.

▲글로벌 동급 모델들과의 벤치마크 성능 비교(자료=LG)

또 엑사원 4.5는 330억 개 파라미터 규모(33B)로 지난해 말 공개한 'K-엑사원'의 약 7분의1 크기지만, 텍스트 이해 및 추론 영역에서 동등한 수준의 성능을 달성했다. 이는 LG AI연구원이 자체 개발한 하이브리드 어텐션 구조와 멀티 토큰 예측 기반의 고속 추론 기술을 적용한 결과다. 공식 지원 언어도 한국어와 영어 외에 스페인어, 독일어, 일본어, 베트남어까지 확장했다.

LG AI연구원 관계자는 "시각 능력 평가 지표에서 높은 평균 점수를 기록했다는 것은 AI가 문서 속 글자나 비정형 데이터를 단순히 인식하는 수준을 넘어, 맥락을 파악하고 질문에 답할 수 있는 이해력을 갖췄다는 의미"라고 설명했다.

한편 LG AI연구원은 2024년 8월 '엑사원 3.0'을 국내 최초로 오픈 웨이트 모델로 공개한 이후 AI 연구 생태계 확장에 기여하기 위한 행보를 이어가고 있다. 엑사원 4.5도 글로벌 오픈소스 플랫폼인 허깅페이스(Hugging Face)에 연구·학술·교육 목적으로 사용할 수 있도록 공개했다. LG는 이달 초 엑사원 경량화 모델 개발을 주제로 청년 AI 전문가 육성 프로그램인 'LG 에이머스' 해커톤을 진행하며 엑사원을 청년들의 AI 역량 강화를 위한 교육 자원으로 활용하기도 했다.

올해 1월에는 동북아역사재단으로부터 데이터를 제공받아 학습을 진행하고 있으며, 고품질 데이터를 보유한 국내 다른 기관들과의 협업을 논의하고 있다. LG AI연구원은 올해 8월 프로젝트 2차수 종료 이후 3차수 진출이 확정되면 본격적으로 모달리티 확장에 나설 계획이며, 궁극적으로 엑사원을 가상 환경을 넘어 물리적 세계를 이해하고 판단하는 피지컬 인텔리전스로 발전시키는 것을 목표로 하고 있다.  

이진식 LG AI연구원 엑사원랩장은 "엑사원 4.5는 LG AI가 텍스트를 넘어 시각 정보까지 이해하는 멀티모달 시대로 진입했음을 보여주는 모델"이라며 "이번 모델을 시작으로 음성과 영상, 물리 환경까지 AI의 이해 범위를 확장해 산업 현장에서 실질적으로 판단하고 행동하는 AI를 만들어가겠다"고 밝혔다.

김명신 LG AI연구원 신뢰안전사무국 총괄은 "한국어 능력을 갖춘 AI는 늘고 있지만, 역사와 문화적 민감성을 깊이 이해하는 것은 차원이 다른 문제"라며 "엑사원은 자체 설계한 AI 위험 분류체계(K-AUT)를 기반으로 풍부한 표현력과 신뢰성을 동시에 확보한 AI로 진화해 나갈 것"이라고 말했다.

Copyright @ NEWSTREE All rights reserved.

뉴스트리 SNS

  • 뉴스트리 네이버 블로그
  • 뉴스트리 네이버 포스트
  • 뉴스트리 유튜브
  • 뉴스트리 페이스북
  • 뉴스트리 인스타그램
  • 뉴스트리 트위터

핫이슈

+

Video

+

ESG

+

시중은행들 생산적 금융 '잰걸음'…지역과 첨단산업에 투자확대

부동산 대출 중심이던 시중은행들이 지역산업 발전과 인공지능(AI), 그리고 첨단산업 등 생산적 금융에 대한 투자를 확대하면서 본격적인 투자경쟁에

SKT, ESG 스타트업 육성하는 '스케치포굿' 참여기업 모집

SK텔레콤이 차세대 ESG 스타트업 발굴·육성 프로그램 'SKTCH for Good(스케치포굿)'을 론칭하고 참여 스타트업을 모집한다고 7일 밝혔다. 참여를 희망하

서울시 기후대응 '엉망'...'생태·사회' 지표 대부분 '낙제점'

서울의 대기질과 생물다양성 자원, 재생가능한 깨끗한 물, 에너지 생산, 폐기물 현황 등 렌즈를 분석한 결과 총 41개 지표 가운데 33개가 기준치에 미달

용기 디자인 살짝 바꿨더니...동원F&B, 플라스틱 사용 14톤 절감 기대

동원F&B 동원식품과학연구원은 플라스틱 사용량 저감을 위해 지난 50여년간 사용해왔던 식용유 용기의 서포트링 디자인을 '12각 돌출 구조'로 개선했

[최남수의 ESG풍향계] ESG와 AI의 충돌

인공지능(AI) 시대가 개막했다. 이제 인류의 시간은 인공지능 이전(Before AI)과 이후(After AI)로 구분될 것이라는 말이 나오고 있을 정도이다. AI 기술의 발

전세계 18개 철강사 탈탄소 평가...포스코·현대제철 '최하위'

포스코·현대제철의 탈탄소 전환도가 전세계 주요 철강사 가운데 최하위권으로 나타났다.지난달 31일(현지시간) 국제환경단체 스틸워치는 전세계

기후/환경

+

와인 맛 바뀌나?… 기후변화에 산지·재배 방식 모두 '흔들'

기후변화로 재배 환경이 달라지면서 미국 뉴욕 핑거레이크 지역 와이너리들이 품종과 재배 방식까지 바꾸고 있다.9일(현지시간) AP통신에 따르면 미국

인간 생존한계 넘은 폭염 시작됐다…35℃에서도 치명적

인간의 생존한계를 넘어선 폭염이 이미 시작됐다는 분석이다. 35℃의 폭염에서도 치명적인 열스트레스가 형성될 수 있다는 연구결과가 나왔다.호주국

[날씨] 9일 강풍 동반한 '요란한 비'...제주는 250㎜ '폭우'

9~10일 전국적으로 강풍과 천둥·번개까지 동반한 요란한 비가 내리겠다. 특히 제주와 남해안을 중심으로 시간당 30㎜ 이상의 집중호우가 쏟아질 것

이탈리아 해변 45% 사라진다고?…해수면 상승과 침식 여파

기후변화로 해수면 상승과 이상기후가 겹치면서 이탈리아 해변이 사라지고 있다.6일(현지시간) 유로뉴스에 따르면 이탈리아는 해수면 상승과 폭풍 증

'기후소송'에 족쇄 채우는 美정부...'석유기업 면책법' 추진

미국의 각 주와 도시들이 석유 등 화석연료 기업을 상대로 손해배상 소송을 확대되자, 공화당과 일부 주정부가 이같은 소송을 원천적으로 차단하는 입

[기후테크] 탄소로 돈을 만든다고?...뉴톤의 AI 평가솔루션

탄소감축 프로젝트가 돈이 될까? 탄소감축 프로젝트를 예측하고 분석해서 '탄소크레딧'이라는 자산을 만들어주는 기업이 있다. 바로 기후테크 스타트

에너지

+

순환경제

+

오피니언

+