banner

소식

Aug 31, 2023

잣 분류에 기계학습 적용

Scientific Reports 12권, 기사 번호: 8799(2022) 이 기사 인용

1128 액세스

2 인용

2 알트메트릭

측정항목 세부정보

잣은 소나무의 번식과 조림에 중요한 역할을 할 뿐만 아니라 영양가가 높아 흔히 섭취하는 견과류입니다. 그러나 잣은 종간 형태적 유사성으로 인해 구별이 어렵다. 따라서 잣의 품질을 향상시키고, 불순물 문제를 신속하고 비파괴적으로 해결하는 것이 중요합니다. 본 연구에서는 7종의 잣(Pinus bungeana, Pinus yunnanensis, Pinus thunbergii, Pinus armandii, Pinus Massoniana, Pinus elliottii 및 Pinus taiwanensis)을 연구종으로 사용하였다. 7종의 잣으로부터 210개의 근적외선(NIR) 스펙트럼을 수집했으며, 5가지 머신러닝 방법(Decision Tree(DT), Random Forest(RF), Multilayer Perceptron(MLP), Support Vector Machine(SVM) 및 Naive Bayes)을 수집했습니다. (NB))를 사용하여 잣의 종을 식별했습니다. 5개의 CNN(Convolutional Neural Network) 모델(VGG16, VGG19, Xception, InceptionV3 및 ResNet50)을 기반으로 분류 모델을 구축하기 위해 형태학적 데이터를 수집하는 데 303개의 이미지가 사용되었습니다. NIR 분광법의 실험 결과에 따르면 가장 좋은 분류 모델은 MLP이고 정확도는 0.99에 가깝습니다. 또 다른 이미지 실험 결과 가장 좋은 분류 모델은 InceptionV3이고 정확도는 0.964에 가깝습니다. 4개의 중요한 파장대역인 951~957 nm, 1,147~1,154 nm, 1,907~1,927 nm, 2,227~2,254 nm가 잣 분류와 높은 관련성이 있는 것으로 나타났습니다. 본 연구는 기계학습이 잣 분류에 효과적임을 보여주며, 다양한 잣 종을 신속하고 비파괴적이며 정확하게 분류할 수 있는 솔루션과 과학적 방법을 제공합니다.

주로 북반구1, 2에 공식적으로 인정된 Pinus Linn 종이 113종 이상 있으며, 이들은 산림 생태계의 중요한 부분을 형성합니다. 잣은 소나무의 씨앗으로 흔히 섭취되는 견과류이며 조림과 번식에 중요한 역할을 합니다3. 잣에는 단백질, 지방산, 미네랄, 비타민이 풍부합니다. 또한 올레산, 리놀렌산 및 기타 불포화 지방산을 함유하고 있어 심혈관 질환 예방에 도움이 됩니다4. 잣의 종인식은 식품안전과 잣의 품질을 위해 중요합니다. 최근 몇 년간 잣 가격의 상승은 막대한 경제적 이익을 가져왔습니다. 2020~2021년 전 세계 잣 생산량은 약 381,700톤이다. 중국은 세계 잣의 주요 수출입국이다. 잣의 시각적 유사성을 고려하면 제품의 혼입 가능성이 매우 높으며, 혼입 문제는 건강과 경제에 큰 영향을 미칩니다. 따라서 잣의 불순물 함유 제품을 편리하고 빠르며 비파괴적인 방법으로 검출하는 방법은 잣의 식품 안전에 대한 과제입니다.

현재 종 식별의 일반적인 방법에는 형태학적 분석5, 분자 표지 기술6,7,8,9, 단백질 전기 영동10, 액체 크로마토그래피11, 스펙트럼 분석12,13,14 및 이미지 인식15이 포함됩니다. 형태학적 분석에는 쉽게 습득할 수 없는 높은 수준의 전문 지식이 필요하며, 따라서 일부 종 간의 큰 형태학적 유사성으로 인해 정확한 식별 비율이 낮습니다16. 분자 마커를 사용하면 더 높은 인식률과 정확도가 제공되지만 이는 파괴적인 방법이고 시간이 많이 걸리며 공개 데이터베이스에 게시된 마커 수에 의해 제한됩니다. 따라서 본 연구에서는 근적외선(NIR) 분광학 및 이미지를 기반으로 잣 분류를 위한 기계학습 모델을 구축합니다.

NIR 분광학은 물질의 적외선 스펙트럼에서 분자 진동을 활용하는 방법론입니다. NIR 분광학 과정에는 샘플에 들어가는 적외선을 방출하는 NIR 장치가 포함됩니다. 여기에서 반사, 굴절, 확산 및 흡수되어 최종적으로 샘플 정보를 다시 검출기로 전달합니다. 이 방법론은 편리하고 빠르며 비파괴적이고 비용 효율적입니다. 이는 밀17, 대두18, 동부19 및 쌀12 생산에 대한 연구를 포함하여 많은 농업 분야에서 사용되었습니다. 지금까지 임업 및 잣 연구에 NIR 분광학을 적용한 보고는 거의 없습니다. 특히, Tigabu 등20은 다양한 영역에서 Pinus sylvestris 견과류의 가시적 NIR 스펙트럼 데이터를 수집하고 MSC(Multiplicative Scatter Correction)를 통해 스펙트럼 데이터를 전처리했습니다. 너트 소스는 SIMCA(Soft Independent Modeling of Class Analogy) 및 PLS-DA(부분 최소 제곱 판별 분석)를 통해 구성되었습니다. Loewe et al.21은 분류를 위해 칠레 농장에서 지중해 Pinus Pinea의 NIR 스펙트럼 데이터를 수집했습니다. Moscetti 등22은 다양한 지역에서 P. Pinea 및 Pinus sibirica 견과류의 근적외선 스펙트럼 데이터를 수집하고 PLS-DA 및 Interval PLS-DA(IPLS-DA) 방법을 사용하여 스펙트럼 분류 모델을 확립했습니다. 그러나 다른 분류 모델의 효과는 더 많은 잣 종에 대해 더 자세히 논의될 필요가 있습니다.

 0.80, with MLP and SVM providing an accuracy of > 0.93. With pre-process of data, the performance of the MLP and SVM models have been greatly improved, the accuracy of the MLP model reaches 0.99, while the SVM model reaches 0.94. Overall, these results show that the RF model is a better classification method when the data are not normalized, while the MLP model is the best for normalized data./p>

공유하다