기계 학습은 인간 Puumala hantavirus 발생에 대한 간단한 조기 경고 규칙을 식별합니다.

Scientific Reports 13권, 기사 번호: 3585(2023) 이 기사 인용

523 액세스

2 알트메트릭

측정항목 세부정보

독일의 인간 푸말라 바이러스(PUUV) 감염은 은행 들쥐 개체수 규모의 변동에 따라 매년 변동합니다. 우리는 연간 발병률 값에 변환을 적용하고 지역 수준에서 이진 인간 감염 위험에 대한 간단하고 강력한 모델을 개발하기 위한 경험적 방법을 확립했습니다. 분류 모델은 기계 학습 알고리즘을 기반으로 하며 전년도의 3가지 기상 매개변수(즉, 2년 전 4월의 토양 온도와 전년도 9월의 토양 온도)만을 입력으로 사용했음에도 불구하고 민감도 85%, 정밀도 71%를 달성했습니다. 년, 그리고 2년 전 9월의 일조 기간. 또한, 우리는 지역 PUUV 발병의 공간적 동시성을 정량화하는 PUUV 발병 지수를 도입하고 이를 2006~2021년 동안 보고된 7건의 발병에 적용했습니다. 마지막으로 분류 모델을 사용하여 PUUV 발병 지수를 추정하여 최대 불확실성 20%를 달성했습니다.

기후 변화로 촉발된 환경 조건은 동물의 자연 서식지를 변경하고 식량 가용성에 영향을 미치며 심지어 종 분포의 변화를 주도함으로써 인수공통 전염병 확산에 점점 더 많은 역할을 합니다. 이 프레임워크 내에서 우리는 독일의 인간 Puumala Orthohantavirus(PUUV) 감염 위험에 대한 간단한 날씨 기반 모델을 개발했습니다.

PUUV는 은행 들쥐(Clethrionomys glareolus, syn. Myodes glareolus)에 의해 전파되는 유럽에서 가장 흔한 한타바이러스입니다. PUUV는 치사율이 0.1~0.4%인 경증~중등도 신증후군 출혈열(전염성 신증)을 유발할 수 있습니다1. 인간 PUUV 감염은 매년 변동합니다. 최근 몇 년 동안 독일에서는 \(>{1000}\) 연간 보고 사례가 있었고2, 일반적으로 과거 벨기에3,4 및 독일5에서 볼 수 있듯이 너도밤나무(Fagus 사양) 마스트 강도로 인해 대규모로 발생했습니다. ,6.

PUUV가 인간에게 전달되는 기본 메커니즘은 은행 들쥐 개체수의 풍부함, PUUV 보급률 및 인간-은행 들쥐 상호 작용에 의존하기 때문에 직접 모델링하기에는 너무 복잡해 보입니다. 이 모든 것은 일시적으로 변동하고 지역적으로 다양합니다. 그럼에도 불구하고 기상 조건은 인간 PUUV 감염 위험에 대한 예측 변수로 사용될 수 있습니다. 왜냐하면 은행 들쥐 개체수의 변동은 지난 2년 동안의 기상 매개변수와 강한 상관관계가 있는 반면 PUUV 확산은 주로 은행 들쥐의 풍부함에 달려 있기 때문입니다3,8, 9.

우리는 2006~2021년에 인간 감염 및 발병률이 높은 독일 지역을 선택하고 지역 수준에서 연간 PUUV 발생률과 월간 날씨 매개변수의 상관관계를 조사했습니다. 우리는 PUUV 발생률의 시간적 변동의 공간적 동기화를 강조하는 데이터 변환을 수행했습니다. 이러한 변환을 통해 지역 관련 발병에 대한 지원 벡터 머신(SVM)을 기반으로 전국적으로 적용 가능하며 쉽게 접근할 수 있는 기상 매개변수만을 기반으로 하는 이진 분류 모델을 개발할 수 있었습니다. 또한, 우리는 연간 인간 PUUV 감염 위험에 대한 지표로 PUUV 발병 지수(POI)를 도입했습니다. POI는 PUUV 발생의 국지적 규모를 고려하여 처음으로 PUUV 발생에 대한 명확한 정의를 허용합니다. POI의 정의는 연간 총 감염 수와는 독립적이지만 그 값은 높은 상관 관계가 있습니다. 마지막으로 이진 분류 모델을 POI에 적용하여 날씨 매개변수의 세 가지 값만으로 좋은 추정치를 제공하기에 충분하다는 것을 보여주었습니다. 결합된 POI 모델은 고위험 연도를 탐지하기 위한 간단한 경험 법칙으로 적용될 수 있습니다. 이러한 모델은 PUUV의 발생을 해석하는 데 사용될 수 있을 뿐만 아니라 설치류 역학에 대한 근사치를 얻는 데에도 사용할 수 있습니다. 이는 인간 건강과 식물 모두를 보호하기 위한 전략과 결정을 지원하는 데 매우 중요합니다.

{900}\) total reported infections in the selected districts have a POI value of \(>\text{50\%}\)./p>\text{77\%}\) and precision \(>\text{67\%}\) (Fig. 3a,b). Weather parameters are for the most part spatially uniform. Thus, the observations from each year formed clusters in the 3D input space of our model. The values of the weather variables for these "cluster centers" were the annual average values over whole Germany./p>\text{90\%}\) was achieved, i.e., 2012 from the outbreak years, and 2008, 2011, 2013, 2016, 2018 and 2020 from the non-outbreak years. The lowest annual accuracy was 41% for 2015 (39 FP), followed by 65% for 2021 (12 FP and 11 FN). For 2014, the only wrong classifications were false negatives (15 FN, 77% accuracy). The highest accuracy was achieved in Baden-Württemberg (90%), and the lowest in North Rhine-Westphalia (66%) and Lower Saxony (69%). There were 6 districts from Baden-Württemberg, 2 from Bavaria, and 1 from Hesse with 100% accuracy. Another 15 districts had only one false classification (9 FP and 6 FN). The maximum numbers of false negatives came from the districts of Borken and Bentheim, with 7 FN and 6 FN, respectively. Borken also had the lowest accuracy among the districts with 44% (7 FN and 2 FP)./p>-\text{0.03}\) (a positive distance means that the observation is above the boundary with respect to V1_ST_9; thus, there is high infection risk for that year) and for \({\text{distance}}_{\text{t}}<-\text{0.37}\) (a negative distance means that the observation is below the boundary with respect to V1_ST_9; thus, there is low infection risk for that year). We compared the groups’ means by a one-way ANOVA with the function f_oneway from the SciPy library14. Based on the F-value of 97 and p value of 1.1 × 10−7, we concluded that the means of the two groups were statistically significantly different./p>-\text{0.03}\)). For distances in the interval \(\text{[}-\text{0.37,}-\text{0.03]}\), where the step occurred and no observation was available, no estimate could be generated. With an uncertainty equal to three times the standard error of the mean, we could estimate the POI for the year \({\text{t}}\) as:/p>

소식

기계 학습은 인간 Puumala hantavirus 발생에 대한 간단한 조기 경고 규칙을 식별합니다.