[더파워=조성복 기자] 인공지능(AI) 챗봇 '이루다' 개발사 스캐터랩이 이루다 데이터베이스(DB)와 딥러닝 모델을 폐기하겠다고 15일 밝혔다.
스캐터랩 측은 "이루다 DB는 비식별화 과정을 거쳐 개별적이고 독립적인 문장 단위로 이뤄져 개인 식별이 가능한 데이터는 포함돼 있지 않다"며 "또한 딥러닝 모델은 비식별화 절차를 거친 데이터를 토대로 대화 패턴만을 학습하고, AI는 데이터를 벡터값으로 기억하기 때문에 개인정보가 유출될 위험이 전혀 없다"고 설명했다.
그러면서 스케터랩은 "이용자들의 불안감을 고려해 이번 AI '이루다'의 DB 전량 및 딥러닝 대화 모델을 폐기하기로 결정했다"고 전했다.
스캐터랩은 현재 한국인터넷진흥원(KISA)와 개인정보보호위원회의 조사를 받고 있는 상태다. 조사가 마무리되는 즉시 이루다 DB와 딥러닝 대화 모델 폐기를 진행할 예정이다.
스캐터랩은 "기존 '연애의 과학'과 '텍스트앳'에서 이용자의 동의를 받고 수집됐던 기존 데이터는 데이터 활용을 원치 않는 이용자로부터 신청을 받은 후 해당 데이터를 모두 삭제할 예정"이라며 "향후 딥러닝 대화 모델에도 적용하지 않을 것"이라고 강조했다.
이어 "관련 후속 조치는 각 어플리케이션 공지를 통해 안내 받을 수 있으며, 향후 신규 가입 및 서비스 이용 시에는 개인정보 수집, 이용 동의 절차를 강화할 계획"이라고 덧붙였다.
스캐터랩은 챗봇 이루다를 만드는 과정에 연애 분석 앱 연애의 과학 이용자들의 카카오톡 데이터를 가져다 쓰면서 개인정보보호법을 위반했다는 의혹을 받고 있다.
더불어 연인들 대화 데이터를 사내 메신저에 공유한 직원이 있었다는 의혹도 받고 있으며, 제대로 익명화하지 않은 데이터를 오픈소스 공유 플랫폼 '깃허브'에 올린 사실도 확인됐다.
연애의 과학 이용자들은 "이루다 DB가 아니라 카카오톡 데이터 전량을 파기해야 한다"고 목소리를 높이고 있다.
스캐터랩은 연애의 과학으로 수집한 카카오톡 데이터 약 100억건에서 1억건을 추려서 이루다 DB로 사용했다고 밝힌 바 있다.