SKT 에이닷 엑스 4.0은 한국어 특화 LLM 모델로, Qwen 2.5 모델 기반에 방대한 한국어 데이터를 추가 학습시켜 개발되었습니다. 직접 사용해본 결과, 구조화된 출력은 강점이지만 한국어 구사 능력이나 특정 문제 해결 능력은 아쉬움이 남습니다.
SKT 에이닷 엑스 4.0, 어떤 모델인가요?
SKT가 2024년 7월 3일 오픈소스로 공개한 에이닷 엑스 4.0은 세계 최고 수준의 한국어 처리 능력을 목표로 개발된 LLM 모델입니다. 알리바바의 Qwen 2.5 모델을 기반으로 하되, 자체 설계한 토크나이저와 방대한 고품질 한국어 데이터를 추가 학습시켜 한국어 처리 효율성과 데이터 보안성을 높인 것이 특징입니다. 자체 테스트 결과, GPT-4o 대비 약 33% 높은 토큰 효율을 보여 API 활용 시 이점을 기대할 수 있습니다. Hugging Face 벤치마크에서도 비슷한 크기의 다른 LLM 모델 대비 우수한 성능을 기록했습니다. (메인 모델 72B, 경량 모델 7B)
에이닷 엑스 4.0 직접 사용 시 느낀 점은?
실제로 Ryzen 5 7500F, 32GB RAM, 3060 12GB VRAM 환경에서 LM Studio를 통해 A.X-4.0-Light-gguf Q8_0 경량 모델을 설치하여 테스트를 진행했습니다. 간단한 글쓰기 작업에서는 주제에 맞춰 구조화된 포맷의 글을 생성하는 능력이 돋보였으나, 한국어 자체를 자연스럽게 구사한다는 느낌은 다소 부족했습니다. 수능 언어영역 기출문제 테스트에서는 정답률이 다른 모델(믿음 2.0, 하이퍼클로바 X 시드)에 비해 낮았으며, 반복 테스트 시 오답을 출력하는 빈도가 높았습니다. 특히 어려운 문제의 경우 지속적으로 오답을 내는 경향을 보였습니다.
수학 및 한국어 분석 능력은 어떠한가요?
수능 수리 기출문제 테스트에서는 최근 리뷰했던 다른 모델들과 비슷한 수준의 정답률을 보여 특별한 장단점을 느끼기 어려웠습니다. 한국어 분석 능력 테스트를 위해 '짜장면 테스트'를 진행한 결과, 경량 모델임에도 불구하고 어느 정도의 분석 능력을 보여주었으나, 복잡하거나 미묘한 뉘앙스를 파악하는 데는 한계가 있었습니다. LLM 모델의 벤치마크 수치가 높다고 해서 실제 사용성이 반드시 비례하는 것은 아니라는 점을 다시 한번 확인할 수 있었습니다.
에이닷 엑스 4.0, 어떤 점을 주의해야 할까요?
에이닷 엑스 4.0은 한국어 데이터 학습에 강점을 두었지만, 아직 완벽한 모델은 아닙니다. 특히 복잡한 추론이나 창의적인 글쓰기, 최신 정보 반영 등에서는 부족함을 보일 수 있습니다. 또한, 오픈소스 모델인 Qwen 2.5 기반이므로, 완전히 독자적인 기술이라기보다는 파생형 모델이라는 점을 인지하는 것이 중요합니다. 벤치마크 결과와 실제 사용 경험 간의 차이가 있을 수 있으므로, 직접 테스트해보며 자신의 사용 목적에 부합하는지 판단하는 것이 좋습니다. 개인의 사용 환경 및 목적에 따라 성능 체감은 달라질 수 있습니다.
자세한 내용은 원본 글에서 확인하세요.











