[표지로 읽는 과학]비밀 공유하지는 않지만 서로 배우는 AI

2021.06.12 06:00
네이처 제공
네이처 제공

국제학술지 네이처는 10일 표지에 떼를 지어 날아가는 종이새의 모습을 실었다. 바닥에 깔린 망에서 날아오르는 새들이 하나씩 무리에 합류하는 모습이다. 수많은 데이터를 학습해야 하는 인공지능(AI)에서도 이런 움직임이 시작되고 있다. 각자의 데이터를 모으면서도 데이터 보안은 유지하는 ‘스웜 러닝(떼 학습)’ 기법이다.

 

요아힘 슐츠 독일 신경퇴행성질환센터 교수 연구팀은 떼 학습을 이용해 유럽 각자의 의료 데이터를 AI로 분석함으로써 백혈병과 폐렴, 신종 코로나바이러스 감염증(COVID-19·코로나19)을 진단하는 기술을 개발했다고 ‘네이처’에 이날 발표했다.

 

최근 의학계는 의료 빅데이터를 분석해 더욱 정확한 정밀 치료법을 찾는 연구가 주목받고 있다. 그러나 문제는 각자의 의료 연구데이터를 교환하기 어렵다는 점이다. 의료 데이터의 개인정보 보호 문제와 함께 환자의 데이터 주권 보호 규정 또한 있다. 엄청난 양의 데이터를 디지털 전송으로 전달하는 것도 쉽지 않다. 연구 결과물을 누가 어떻게 활용할지도 문제가 된다.

 

연구팀은 이런 문제를 해결하기기 위해 떼 학습 기법을 도입했다. 떼 학습은 기계학습과 네트워크 간 정보교환을 결합한 기술로 미국의 휼렛패커드(HP)가 처음 개발했다. 데이터를 옮길 필요 없이 네트워크에서 알고리즘과 매개 변수만 공유해 AI를 학습시킨다. 각자의 데이터를 보호할 수 있다는 게 큰 장점이다. 고 응 림 HP 인공지능 최고기술책임자(CTO)는 “떼 학습은 모든 참가자가 기밀 데이터를 공유하지 않고도 서로 배울 수 있다”고 설명했다.

 

연구팀은 백혈구 유전자 전사체와 폐 X선 영상 분석에 떼 학습을 적용했다. 백혈구 유전자에서는 어떤 질병에 면역체계가 대응했는지를 분석할 수 있다. 연구팀은 127개 병원에서 1만 6400개의 혈액 전사체와 9만 5000건의 흉부 X선 영상을 연결해 학습했다. 이를 통해 급성 골수성 백혈병과 급성 림프모구 백혈병, 결핵, 코로나19 발병 여부를 분석했다.

 

그 결과 환자의 발병 여부를 전사체로 분석할 확률은 네 가지 질병에 대해 평균 약 90%로 나타났다. X선 영상을 토대로 평가했을 때는 76~86% 범위였다. 슐츠 교수는 “이 방법론은 유전자 활동 특이성이 특히 눈에 띄는 백혈병에서 가장 효과적이지만 결핵과 코로나19 정확도도 매우 높았다”며 “우리 연구는 떼 학습이 여러 다른 데이터에 성공적으로 적용될 수 있음을 증명한다”고 말했다.

 

슐츠 교수는 “떼 학습이 의학 연구와 기타 데이터 분야에 큰 도움이 될 수 있다고 확신한다”며 “이번 연구는 테스트에 불과하고 앞으로 이 기술을 알츠하이머와 신경 퇴행성 질환에 적용할 계획”이라고 말했다. 이어 “떼 학습은 진정한 판도를 바꿀 수 있는 잠재력을 갖고 있으며 전 세계적으로 의학 경험을 더 쉽게 접할 수 있도록 도울 수 있다”고 말했다.

메일로 더 많은 기사를 받아보세요!

댓글 0

작성하기

    의견쓰기 폼
    0/150