banner

소식

Sep 28, 2023

AI와 비비교 검증

Scientific Reports 13권, 기사 번호: 3439(2023) 이 기사 인용

1082 액세스

12 알트메트릭

측정항목 세부정보

이 기사에 대한 게시자 수정 사항이 2023년 5월 3일에 게시되었습니다.

이 기사는 업데이트되었습니다

뇌 자기공명영상(MRI) 스캔의 자동 분할 및 체적 측정은 파킨슨병(PD) 및 파킨슨 플러스 증후군(P-plus) 진단에 필수적입니다. 진단 성능을 향상시키기 위해 뇌 MRI 분할에 딥러닝(DL) 모델을 채택하고 그 성능을 표준 비DL 방법과 비교했습니다. 우리는 건강한 대조군(\(n=105\))과 PD(\(n=105\)), 다발성 전신 위축(\(n=132\)) 및 진행성 핵상 마비(\(n=132\)) 환자의 뇌 MRI 스캔을 수집했습니다. (n=69\)) 2017년 1월부터 2020년 12월까지 삼성서울병원에서 진행되었습니다. 표준 비DL 모델인 FreeSurfer(FS)를 사용하여 중뇌, 교뇌, 꼬리뼈, 피각, 담창, 뇌의 6가지 뇌 구조를 분할했습니다. 이를 대표적인 CNN(Convolutional Neural Network) 및 ViT(Vision Transformer) 기반 모델인 DL 모델에 대한 주석 데이터로 간주했습니다. 정상, PD, P-plus 사례를 구별하기 위한 주사위 점수와 곡선 아래 면적(AUC)을 계산하여 DL 접근 방식을 통해 속도를 높이면서 FS 성능을 그대로 재현할 수 있는 측정값을 결정했습니다. 환자당 6개 뇌 구조에 대한 CNN과 ViT의 분할 시간은 각각 51.26±2.50초와 1101.82±22.31초로 FS(15,735±1.07초)보다 14~300배 빠르다. 두 DL 모델의 주사위 점수는 충분히 높았으므로(> 0.85) 질병 분류에 대한 AUC는 FS의 AUC보다 열등하지 않았습니다. 모든 뇌 부위를 기준으로 정상 vs. P-plus, PD vs. P-plus(다발성 전신위축증-파킨슨병형 제외) 분류에서 DL 모델과 FS 모두 0.8 이상의 AUC를 보여 DL 모델의 임상적 가치를 입증했습니다. FS에. DL은 뇌 분할 및 감별 진단 성능을 저하시키지 않으면서 분석 시간을 크게 단축합니다. 우리의 연구 결과는 임상 환경에서 DL 뇌 MRI 분할을 채택하고 뇌 연구를 발전시키는 데 기여할 수 있습니다.

파킨슨병(PD) 진단은 주로 임상적 표현에 기초합니다. 그러나 위험 신호1라고 불리는 비정형 증상의 경우, 다계통 위축(MSA) 및 진행성 핵상 마비(PSP)와 같은 파킨슨 플러스 증후군(P-plus)을 진단하려면 뇌 자기공명영상(MRI)이 필수적입니다. MRI는 진단 정확도를 향상시키고 질병 진행을 모니터링하는 데 사용될 수 있습니다2. 뇌 MRI는 P-plus에서는 나타나지만 PD2,3,4에서는 나타나지 않는 다양한 특징을 밝힐 수 있습니다. 예를 들어, PSP 환자는 벌새 징후로 알려진 뚜렷한 중뇌 위축5을 나타냅니다. MSA-파킨슨병 유형(MSA-P)의 경우 피각은 위축되어 있고 측면 경계가 편평하며 T1 강조 경사 에코 이미지에서 저신호를 나타냅니다. MSA-소뇌 유형(MSA-C) 환자는 뇌교와 중소뇌각에서 우세한 위축을 보여 중뇌 대 뇌교 비율이 증가하고 자기 공명 파킨슨증 지수가 감소합니다7. 따라서 이러한 뇌 구조의 부피에 대한 정량적 측정도 평가되었으며 P-plus8과 PD를 구별하는 데 높은 민감도와 특이성을 보여줍니다.

중뇌 영역을 평가하여 얻은 진단 민감도와 특이도는 일반적으로 PSP, MSA 및 PD9를 구별하는 데 높지만 이 영역에 대한 시각적 평가는 정량적이지 않고 객관성이 부족하며 의사의 기술이나 이미지 획득에 크게 의존합니다. 결과적으로, 육안 평가를 기반으로 한 진단은 80% 미만으로 떨어지는 광범위한 정확도를 보여줍니다10,11,12. 뇌 MRI의 일관되고 정량적인 분석을 개발하기 위해 중뇌 영역의 용적 측정이 정확한 진단을 위한 최적의 예측 변수로 사용되었습니다6,8,13,14. 따라서 뇌 이미지 분할은 예측 모델이나 부피 측정 및 진단을 위한 자동화된 기계 학습(ML) 방법을 기반으로 하는 대부분의 다운스트림 분석에서 중요한 단계가 되었습니다.

0.76). There was no significant difference between FS and the DL models (p-value of 0.05 or higher) in all highest AUCs./p>

공유하다