예측 위험 모델에 대한 지속적인 학습을 위해 의료 기관 전반의 임상 데이터 활용

Scientific Reports 12권, 기사 번호: 8380(2022) 이 기사 인용

2018 액세스

5 인용

11 알트메트릭

측정항목 세부정보

새로운 기관의 환자 치료 에피소드(현장별 교육)로부터 학습할 수 있는 기계 학습 기반 임상 예측 모델의 고유한 유연성은 외부 환자 코호트에 적용할 때 성능 저하를 초래합니다. 기관 간 임상 빅 데이터의 잠재력을 최대한 활용하려면 기계 학습 시스템이 기관 경계를 넘어 지식을 전달하고 이전에 학습된 패턴을 잊지 않으면서 환자 치료의 새로운 에피소드에서 학습할 수 있는 능력을 확보해야 합니다. 이 작업에서 우리는 WUPERR(Weight Uncertainty Propagation and Episodic Representation Replay)라는 개인 정보 보호 학습 알고리즘을 개발하고 4개의 서로 다른 의료 시스템에 걸쳐 104,000명 이상의 환자 데이터를 사용하여 패혈증 조기 예측이라는 맥락에서 알고리즘을 검증했습니다. 우리는 제안된 연속 학습 알고리즘이 새로운 환자 코호트에 대해 훈련되면 이전 코호트에 대한 경쟁 방법보다 더 높은 예측 성능을 유지할 수 있다는 가설을 테스트했습니다. 패혈증 예측 작업에서 4개 병원 시스템(즉, HA, HB, HC 및 HD 병원)에 걸쳐 딥 러닝 모델을 점진적으로 훈련한 후 WUPERR은 기본 전이 학습 접근 방식과 비교하여 처음 3개 병원에서 가장 높은 긍정적 예측 값을 유지했습니다. (HA: 39.27% 대 31.27%, HB: 25.34% 대 22.34%, HC: 30.33% 대 28.33%). 제안된 접근 방식은 개인정보를 보호하는 방식으로 기관 간 임상 빅데이터로부터 학습할 수 있는 보다 일반화 가능한 모델을 구축할 수 있는 잠재력을 가지고 있습니다.

지난 10년간 인공지능의 눈부신 부활과 산업 자동화, 고객 만족도 및 수익 최적화에 미치는 영향으로 인해 관련 기술을 의료 분야에 적용하는 데 대한 관심이 높아지고 있습니다1,2,3. 특히, 딥 러닝 기술은 선별 및 분류, 진단, 예후, 의사 결정 지원 및 치료 권장 사항을 포함하여 임상 의학에서 주목을 받고 있습니다4,5,6,7,8,9,10,11,12,13. 광범위한 임상 채택을 위해서는 딥 러닝 기반 임상 모델이 일반화 가능하고 휴대 가능해야 하며, 모델 훈련 및 평가에 사용되는 데이터의 환자 개인정보를 보호해야 합니다14,15. 실제로 단일 의료 시스템의 데이터로 훈련된 모델은 지역 인구 통계, 실험실 장비 및 분석, 전자 건강 기록(EHR), 데이터 측정 빈도, 임상 및 행정 관행의 차이로 인해 일반화 가능성이 부족한 경우가 많습니다. 다양한 임상 진단의 코딩 및 정의16. 새로운 데이터/경험으로부터 학습하기 위해 딥러닝 모델의 고유한 유연성과 임상 빅데이터를 결합하면 이론적으로 이러한 이질성을 일부 해결할 수 있다는 주장이 제기되어 왔습니다. 그러나 의료 데이터는 여전히 고립되어 있으며 데이터 접근성과 환자 개인 정보 보호는 의료 영역에서 고급 분석의 힘을 완전히 활용하는 데 상당한 어려움을 야기합니다15,17. 따라서 현재 모델 개발에 활용되는 일반적인 임상 데이터는 딥 러닝의 산업적 적용을 촉진하는 데이터보다 몇 배 더 작은 경우가 많습니다18.

널리 사용되는 기계 학습 기반 패혈증 예측 위험 점수에 대한 최근의 독립적 및 외부 검증에서는 데이터 분포 변화 및 모집단 사례 혼합의 변화가 있는 경우 모델 일반화 가능성의 문제를 강조했습니다. 딥 러닝 시스템의 외부 타당성을 향상시키는 잠재적인 솔루션은 모든 새로운 치료 환경(전이 학습이라고도 함)에서 이러한 모델을 미세 조정하는 것입니다. 그러나 이러한 접근 방식은 다양한 치료 환경에서 동일한 알고리즘의 여러 버전이 작동하게 하여 변경 관리에 관한 규제적 우려와 일반화 가능한 지식 생산에 관한 과학적 과제를 제기할 수 있습니다23. 따라서 개인 정보 보호 방식으로 환자의 잠재적인 위험을 관리하면서 수용 가능한 성능을 유지할 수 있는 잘 정의된 변경 제어 계획24을 사용하여 다양한 환자 집단에 걸쳐 환자 데이터를 활용할 수 있는 학습 알고리즘 및 모델을 설계하는 것이 바람직합니다.

소식

예측 위험 모델에 대한 지속적인 학습을 위해 의료 기관 전반의 임상 데이터 활용