[더파워 최병수 기자] 개인정보 규제가 강화되는 가운데 데이터를 중앙에 모으지 않고도 학습 효율을 높이는 토스의 연합학습 기술이 세계 최고 수준 AI 학회에서 성과를 인정받았다.
토스는 3일 자사가 개발에 참여한 인공지능(AI) 논문이 ‘뉴립스(NeurIPS) 2025’에 채택됐다고 밝혔다.
토스에 따르면 이번 논문은 토스 페이스모델링팀 이진우 연구원을 중심으로 서울대학교 비전랩과 공동 진행한 연구 성과다. 뉴립스는 머신러닝·신경정보처리 분야에서 가장 영향력 있는 국제 학회 중 하나로, 논문 채택률이 약 20%에 불과하다. 올해 학회는 2일부터 7일까지 미국 샌디에이고 컨벤션센터에서 열리며, 전 세계 연구자들이 최신 AI 연구 성과를 공유한다.
채택된 논문은 ‘이질적인 연합 학습 환경에서의 일반화 범주 발견을 위한 로컬 사전 정렬(FedLPA: Local Prior Alignment for Heterogeneous Federated Generalized Category Discovery)’로, ‘로컬 사전 정렬 기반 연합학습(Federated Local Prior Alignment, FedLPA)’ 기법을 제안했다. 개인정보 보호 규제로 데이터를 중앙 서버로 이전할 수 없는 국가나 서비스 환경에서도 AI 모델을 학습할 수 있도록 설계된 것이 핵심이다. 국가·사용자 집단별로 데이터 특성이 다르거나 기존에 없던 새로운 유형의 데이터가 등장할 때 성능이 급격히 떨어지는 기존 연합학습의 한계를 보완했다.
연구팀은 국가·사용자 그룹 등 비슷한 특성을 지닌 데이터를 자동으로 묶어주는 ‘인포맵(Infomap)’ 기반 로컬 군집화 기법과, 예측값을 정렬해 학습 안정성을 높이는 ‘로컬 프라이어 얼라인먼트(Local Prior Alignment)’ 기법을 결합했다. 이를 통해 각 디바이스가 보유한 데이터 구조를 스스로 파악해 활용하도록 만들었고, 사전에 범주 수나 데이터 분포를 알기 어려운 환경에서도 새로운 유형의 범주를 찾아내는 ‘일반화 범주 발견(Generalized Category Discovery, GCD)’ 성능을 입증했다.
이번 연구는 개인정보 보호와 모델 성능을 동시에 충족할 수 있는 기반 기술이라는 점에서도 의미가 크다는 평가다. 개인정보 규제가 엄격한 국가에서도 각국의 법적 요구사항을 지키면서 글로벌 AI 모델을 구축할 수 있음을 보여줬기 때문이다. 이진우 연구원은 “이번 연구는 규제로 인해 데이터를 서버로 이전할 수 없고, 각 클라이언트의 데이터 분포도 제각각이며, 새로운 범주의 개수조차 알 수 없는 혹독한 상황에서도 효율적인 학습이 가능하도록 알고리즘을 최적화한 점이 핵심”이라고 말했다.
토스 관계자는 “토스의 AI 역량이 세계적인 학회에서 처음으로 공식 인정을 받았다는 점에서 의미가 크다”며 “실제 서비스에 적용 가능한 기술 연구를 지속해 개인정보 보호를 지키면서도 더 정교한 AI 기반 서비스를 제공하겠다”고 말했다.
최병수 더파워 기자 news@thepowernews.co.kr