사례형시험서 범용 AI 대비 최대 218점 우위
[더파워 최성민 기자] 법률 AI 스타트업 엘박스(LBOX)가 제15회 변호사시험 선택형과 사례형 시험에서 기록적인 성적을 거두며 법률 특화 AI의 성능을 입증했다고 밝혔다.
엘박스 AI는 공법, 형사법, 민사법 선택형 시험 150개 문항 중 141개를 맞춰 94%의 정답률을 달성했다. 이는 당해 시험 합격선인 99개보다 42개 많은 수치다.
사례형 시험에서는 선택법을 제외하고 528점(만점 750점)을 기록했다. 이는 ChatGPT, Gemini, Claude 등 주요 범용 AI 모델과 비교했을 때 최대 218점 높은 점수다. 채점은 인공지능 학회인 EACL 2026에서 엘박스가 발표한 논문의 평가 방법론에 기반한 자체 기준으로 진행됐다.
이번 시험에서 엘박스 AI는 민사집행법상 청구이의의 소, 자유위임원칙 위반 여부 등 까다로운 법률 쟁점을 식별하고 사실관계를 구조화했다. 단순 지식 암기를 넘어 변호사 실무 역량인 법리 적용과 논리적 결론 도출 과정을 완결성 있게 서술하며 범용 모델과의 격차를 벌렸다.
이러한 결과는 2025년 11월 진행한 에이전틱(Agentic) AI로의 구조 전환에 따른 성과로 분석된다. 엘박스의 에이전틱 AI는 사실관계 정리, 쟁점 도출, 판례 리서치, 법리 구성 등 법률 전문가의 사고 과정을 단계별 추론 과정으로 구현하여 다각도에서 문제를 해결하도록 설계됐다.
엘박스의 기술력은 주요 사법 및 수사기관에서도 활용되고 있다. 엘박스는 대법원의 ‘재판지원 AI 시스템’ 구축 사업에 참여하여 AI 서비스 워크플로우 설계와 성능 평가 체계 구축을 담당하고 있다. 해당 사업은 2028년까지 총 145억 원의 사업비가 투입되는 대규모 프로젝트다.
수사기관과의 협업도 활발하다. 2025년 8월 대검찰청과 정식 계약을 체결해 검사 전용 엘박스 AI를 제공하고 있으며, 경찰청의 ‘인터넷 판례·법령 검색 서비스’ 공급 사업자로도 3년 연속 선정됐다. 이는 공공 영역에서 엘박스 AI의 신뢰성과 전문성을 인정받은 결과다.
2026년 3월 말 기준 국내 변호사의 70%가 엘박스를 이용하고 있으며 로펌과 대기업 등 1,600여 개의 고객사를 확보했다. 또한 EMNLP, EACL 등 세계적인 자연어처리 학회에 지속적으로 논문을 출판하며 글로벌 수준의 법률 AI 연구 역량을 대외적으로 입증하고 있다.
엘박스 이진 대표는 “작년 11월 에이전틱 AI 구조로 전환하며 기술 변화를 선도적으로 도입했다”며 “전문가의 문제 해결 과정을 모사한 설계가 실질적인 성과로 이어졌으며 향후에도 법률 전문가의 업무 혁신을 위한 기술 고도화에 매진할 것”이라고 밝혔다.
최성민 더파워 기자 Sungmin@thepowernews.co.kr