[더파워 이설아 기자] 디지털 헬스케어 이용이 일상화되는 가운데 고령층의 디지털 헬스 리터러시를 보다 정밀하게 예측할 수 있는 설명가능한 머신러닝 기반 분석 모델이 개발됐다.
가톨릭대학교 가톨릭중앙의료원 기초의학사업추진단 인공지능뇌과학사업단은 고령층의 디지털 헬스 리터러시를 예측하는 설명가능한 머신러닝 접근법을 개발했다고 13일 밝혔다.
이번 연구는 전지원 가톨릭대 의과대학 의료정보학교실 교수와 박충희 연구원을 비롯한 공동 연구팀이 수행했다. 연구팀은 기존 디지털 헬스 리터러시 평가가 자기보고식 설문에 치우쳐 실제 수행 능력을 충분히 반영하지 못한다는 한계를 보완하기 위해, 자기보고식 평가와 수행 기반 지표를 결합한 통합 분석 프레임워크를 제시했다. 설명가능한 머신러닝은 단순히 예측 정확도를 높이는 데 그치지 않고, 결과가 어떤 요인과 과정을 통해 도출됐는지를 파악할 수 있도록 한 기술이다.
연구는 두 개의 독립된 자료를 바탕으로 2단계 방식으로 진행됐다. 1단계에서는 60~74세 고령자 30명을 대상으로 디지털 및 정보 이해 능력을 평가한 파일럿 코호트 자료와, 55~74세 고령자 1000명을 대상으로 실시한 온라인 설문 자료를 분석했다. 연구팀은 이들 자료에 베이지안 선형회귀를 적용해 주요 설명 변수를 도출했다.
이어 2단계에서는 도출된 변수를 활용해 설문 데이터의 KeHEALS(Korean version of the eHealth Literacy Scale) 수준을 예측하는 이진 분류 모델을 구축하고, 5개 머신러닝 알고리즘으로 성능을 비교했다. 이 가운데 범주형 부스팅 모형인 CatBoost 알고리즘이 가장 높은 성능을 보였고, 정확도를 나타내는 AUC는 0.84로 나타났다. 연구팀은 여기에 SHAP(Shapley Additive Explanations) 분석을 적용해 각 변수의 기여도를 해석했다.
분석 결과 건강 관련 앱에 대한 관심과 디지털 기기 사용, 운동은 고령층 디지털 헬스 리터러시에 긍정적인 영향을 미치는 요인으로 확인됐다. 반면 연령과 음주, 흡연은 부정적 영향을 주는 변수로 나타났다. 연구팀은 이를 통해 주관적 인식과 객관적 수행 능력의 관계를 정밀하게 분석하고, 고령층의 디지털 헬스 리터러시를 결정하는 요인을 정량적으로 도출했다고 설명했다.
전지원 교수는 "디지털 전환이 가속화되는 환경에서 기술적 혜택에서 소외되기 쉬운 고령층의 디지털 격차를 설명가능한 인공지능을 통해 정밀하게 분석하고자 했다"며 "이를 바탕으로 노년층 개개인의 특성에 맞춘 맞춤형 디지털 돌봄이 가능해질 것으로 기대한다"고 말했다. 이어 "앞으로도 AI 기술이 인간을 향하는 기술로 발전할 수 있도록 양질의 의료데이터 구축과 서비스 발굴에 힘쓰겠다"고 덧붙였다.