혼합 경험적 베이지안 크리깅 및 지원 벡터 머신 회귀를 이용한 교외 및 도시 토양의 니켈 농도 예측

Nature.com을 방문해 주셔서 감사합니다. 현재 사용 중인 브라우저 버전은 CSS에 대한 지원이 제한적입니다. 최상의 환경을 위해 최신 브라우저를 사용하거나 Internet Explorer에서 호환 모드를 끄는 것이 좋습니다. 지속적인 지원을 보장하기 위해 당분간 스타일과 JavaScript 없이 사이트를 표시하겠습니다.
토양 오염은 인간 활동으로 인해 발생하는 큰 문제입니다.잠재적으로 독성이 있는 원소(PTE)의 공간적 분포는 대부분의 도시 및 도시 주변 지역에서 다양합니다.따라서 이러한 토양의 PTE 함량을 공간적으로 예측하는 것은 어렵습니다.체코 공화국의 Frydek Mistek에서 총 115개의 샘플을 얻었습니다.칼슘(Ca), 마그네슘(Mg), 칼륨(K) 및 니켈(Ni) 농도는 유도 결합 플라즈마 방출 분광법을 사용하여 결정했습니다.반응 변수는 Ni이고 예측 변수는 Ca, Mg 및 K입니다.반응 변수와 예측 변수 간의 상관 행렬은 원소 간에 만족스러운 상관 관계를 보여줍니다.예측 결과는 지원 벡터 머신 회귀(SVMR)가 잘 수행되었음을 보여주었지만 추정된 평균 제곱근 오차(RMSE)(235.974 mg/kg)와 평균 절대 오차(MAE)(166.946 mg/kg)는 적용된 다른 방법보다 높았습니다.경험적 베이지안 크리깅-다중 선형 혼합 모델 회귀 분석(EBK-MLR)은 결정 계수가 0.1 미만으로 나타나 성능이 좋지 않습니다.경험적 베이지안 크리깅-지원 벡터 머신 회귀 분석(EBK-SVMR) 모델이 가장 우수한 모델이었으며, RMSE(95.479mg/kg)와 MAE(77.368mg/kg) 값이 낮고 결정 계수(R2 = 0.637)가 높습니다.EBK-SVMR 모델링 기술 출력은 자체 조직화 맵을 사용하여 시각화됩니다.하이브리드 모델 CakMg-EBK-SVMR 구성 요소의 평면에 있는 클러스터링된 뉴런은 도시와 도시 주변 토양의 Ni 농도를 예측하는 여러 색상 패턴을 보여줍니다.결과는 EBK와 SVMR을 결합하는 것이 도시와 도시 주변 토양의 Ni 농도를 예측하는 효과적인 기술임을 보여줍니다.
니켈(Ni)은 대기 질소 고정(N)과 요소 대사에 기여하기 때문에 식물의 미량 영양소로 간주됩니다. 이 두 가지 모두 종자 발아에 필요합니다. 종자 발아에 기여하는 것 외에도 Ni는 곰팡이 및 박테리아 억제제로 작용하여 식물 발달을 촉진할 수 있습니다. 토양에 니켈이 부족하면 식물이 니켈을 흡수하여 잎의 엽록소 결핍을 초래합니다. 예를 들어, 완두콩과 녹두는 질소 고정을 최적화하기 위해 니켈 기반 비료를 사용해야 합니다. 토양을 비옥하게 하고 콩과 식물의 토양 질소 고정 능력을 높이기 위해 니켈 기반 비료를 계속 사용하면 토양의 니켈 농도가 지속적으로 증가합니다. 니켈은 식물의 미량 영양소이지만 토양에서 과도한 섭취는 이롭기보다 해로울 수 있습니다. 토양의 니켈 독성은 토양 pH를 최소화하고 식물 성장에 필수 영양소인 철의 흡수를 방해합니다. Liu3에 따르면 Ni는 식물 발달과 성장에 필요한 17번째 중요한 원소로 밝혀졌습니다. 식물 발달에 있어서 니켈의 역할 외에도 성장, 인간은 다양한 용도로 그것을 필요로 합니다. 전기 도금, 니켈 기반 합금의 생산, 자동차 산업의 점화 장치 및 스파크 플러그 제조는 모두 다양한 산업 부문에서 니켈을 사용해야 합니다. 또한 니켈 기반 합금과 전기 도금 제품은 주방용품, 무도회장 액세서리, 식품 산업 용품, 전기, 전선 및 케이블, 제트 터빈, 수술용 임플란트, 섬유 및 조선에서 널리 사용되었습니다. 토양(즉, 표토)의 Ni가 풍부한 수준은 인위적 및 자연적 출처 모두에 기인하지만 주로 Ni는 인위적 출처가 아닌 자연적 출처입니다. 니켈의 자연적 출처에는 화산 폭발, 초목, 산불 및 지질학적 과정이 포함됩니다. 그러나 인위적인 출처에는 철강 산업의 니켈/카드뮴 배터리, 전기 도금, 아크 용접, 디젤 및 연료유, 석탄 연소 및 폐기물과 슬러지 소각으로 인한 대기 배출이 포함됩니다.니켈 축적7,8.Freedman 및 Hutchinson9과 Manyiwa et al.10에 따르면, 직접 및 인접 환경에서 표토 오염의 주요 출처는 주로 니켈-구리 기반 제련소와 광산입니다.캐나다의 서드베리 니켈-구리 정유소 주변의 표토는 26,000mg/kg11로 니켈 오염 수준이 가장 높았습니다.반대로 러시아의 니켈 생산으로 인한 오염으로 노르웨이 토양의 니켈 농도가 더 높아졌습니다.Alms et al.11에 따르면 12, 이 지역의 최상위 경작지(러시아의 니켈 생산량)에서 HNO3로 추출 가능한 니켈의 양은 6.25~136.88mg/kg으로, 평균 30.43mg/kg, 기준 농도 25mg/kg에 해당합니다. 카바타 11에 따르면, 연속적인 작물 시즌 동안 도시 또는 도시 주변 토양의 농경 토양에 인산 비료를 적용하면 토양에 인산 비료가 침투하거나 오염될 수 있습니다. 니켈의 인간에 대한 잠재적 영향은 돌연변이, 염색체 손상, Z-DNA 생성, 차단된 DNA 절제 복구 또는 후성유전적 과정을 통해 암으로 이어질 수 있습니다. 동물 실험에서 니켈은 다양한 종양을 유발할 수 있는 잠재력이 있는 것으로 밝혀졌으며, 발암성 니켈 복합체는 이러한 종양을 악화시킬 수 있습니다.
토양 오염 평가는 토양-식물 관계, 토양 및 토양 생물학적 관계, 생태적 저하 및 환경 영향 평가에서 발생하는 광범위한 건강 관련 문제로 인해 최근 번창했습니다.지금까지 토양의 Ni와 같은 잠재적으로 독성이 있는 원소(PTE)의 공간적 예측은 전통적인 방법을 사용하여 힘들고 시간이 많이 걸렸습니다.디지털 토양 매핑(DSM)의 출현과 현재의 성공15으로 예측 토양 매핑(PSM)이 크게 개선되었습니다.Minasny와 McBratney16에 따르면 예측 토양 매핑(DSM)은 토양 과학의 중요한 하위 분야임이 입증되었습니다.Lagacherie와 McBratney(2006)는 DSM을 "현장 및 실험실 관찰 방법과 공간적 및 비공간적 토양 추론 시스템을 사용하여 공간적 토양 정보 시스템을 만들고 채우는 것"으로 정의합니다.McBratney et al. 17은 현대 DSM 또는 PSM이 PTE, 토양 유형 및 토양 속성의 공간적 분포를 예측하거나 매핑하는 데 가장 효과적인 기술이라고 설명합니다. 지리통계 및 머신 러닝 알고리즘(MLA)은 중요하고 최소한의 데이터를 사용하여 컴퓨터의 도움으로 디지털화된 지도를 만드는 DSM 모델링 기술입니다.
Deutsch18과 Olea19는 지구통계학을 "공간적 속성의 표현을 다루는 수치 기법들의 집합으로, 주로 확률론적 모델을 사용하며, 예를 들어 시계열 분석이 시간 데이터를 어떻게 특성화하는지와 같은 기법"으로 정의합니다. 지구통계학은 주로 각 데이터세트의 공간적 값의 종속성을 정량화하고 정의할 수 있는 변이도(variogram)의 평가를 포함합니다.20 Gumiaux et al. 20은 지구통계학에서 변이도 평가가 (a) 데이터 상관관계의 규모 계산, (b) 데이터 세트 불일치의 이방성 식별 및 계산, (c) 지역 효과와 분리된 측정 데이터의 내재적 오차를 고려하는 것 외에도 지역 효과도 추정하는 것을 포함한 세 가지 원칙에 기반한다는 것을 더욱 잘 보여줍니다. 이러한 개념을 바탕으로 지구통계학에서는 일반 크리깅, 공동 크리깅, 일반 크리깅, 경험적 베이지안 크리깅, 단순 크리깅 방법 및 PTE, 토양 특성 및 토양 유형을 매핑하거나 예측하기 위한 기타 잘 알려진 보간 기술을 포함하여 많은 보간 기술이 사용됩니다.
기계 학습 알고리즘(MLA)은 비교적 새로운 기술로, 주로 데이터 마이닝, 데이터 패턴 식별에 사용되는 알고리즘을 기반으로 대규모 비선형 데이터 클래스를 사용하며 토양 과학 및 반환 작업과 같은 과학 분야에서 분류에 반복적으로 적용됩니다.수많은 연구 논문이 토양의 PTE를 예측하기 위해 MLA 모델에 의존하고 있습니다.Tan et al. 22(농업 토양의 중금속 추정을 위한 랜덤 포레스트), Sakizadeh et al. 23(지원 벡터 머신 및 인공 신경망을 사용한 모델링) 토양 오염 등이 있습니다.또한 Vega et al. 24(토양의 중금속 유지 및 흡착 모델링을 위한 CART), Sun et al. 25(입방체 적용은 토양의 Cd 분포) 및 k-최근접 이웃, 일반화된 부스트 회귀, 부스트 회귀 트리와 같은 다른 알고리즘도 토양의 PTE를 예측하기 위해 MLA를 적용했습니다.
예측이나 매핑에 DSM 알고리즘을 적용하는 것은 여러 과제에 직면합니다.많은 저자는 MLA가 지구 통계보다 우수하다고 믿고 그 반대도 마찬가지입니다.하나가 다른 하나보다 우수하지만, 두 가지를 결합하면 DSM15에서 매핑이나 예측의 정확도 수준이 향상됩니다.Woodcock 및 Gopal26 Finke27;Pontius 및 Cheuk28 및 Grunwald29는 예측 토양 매핑의 결함과 일부 오류에 대해 언급합니다.토양 과학자들은 DSM 매핑 및 예측의 효과, 정확성 및 예측 가능성을 최적화하기 위해 다양한 기술을 시도했습니다.불확실성과 검증의 조합은 효과를 최적화하고 결함을 줄이기 위해 DSM에 통합된 여러 측면 중 하나입니다.그러나 Agyeman et al.15는 맵 생성 및 예측으로 인해 도입된 검증 동작과 불확실성을 맵 품질을 개선하기 위해 독립적으로 검증해야 한다고 설명합니다.DSM의 한계는 불확실성의 구성 요소를 포함하는 지리적으로 분산된 토양 품질 때문입니다. 그러나 DSM의 불확실성은 공변량 오차, 모델 오차, 위치 오차, 분석 오차 등 여러 오차 원인에서 비롯될 수 있습니다.31 MLA 및 지구 통계 과정에서 발생하는 모델링 부정확성은 이해 부족과 관련이 있으며, 궁극적으로 실제 과정을 지나치게 단순화하는 결과를 초래합니다.32 모델링의 특성과 관계없이 부정확성은 모델링 매개변수, 수학적 모델 예측 또는 보간법에 기인할 수 있습니다.33 최근에는 지도 작성 및 예측에 지구 통계와 MLA를 통합하는 것을 촉진하는 새로운 DSM 추세가 등장했습니다.Sergeev et al.34;Subbotina et al.35;Tarasov et al.36 및 Tarasov et al.37과 같은 여러 토양 과학자와 저자는 지구 통계와 머신 러닝의 정확한 품질을 활용하여 예측 및 지도 작성의 효율성을 개선하는 하이브리드 모델을 생성했습니다. 품질. 이러한 하이브리드 또는 결합 알고리즘 모델 중 일부는 인공 신경망 크리깅(ANN-RK), 다층 퍼셉트론 잔여 크리깅(MLP-RK), 일반화 회귀 신경망 잔여 크리깅(GR-NNRK)36, 인공 신경망 크리깅-다층 퍼셉트론(ANN-K-MLP)37 및 공동 크리깅 및 가우시안 프로세스 회귀38입니다.
Sergeev et al.에 따르면 다양한 모델링 기법을 결합하면 단일 모델을 개발하는 것보다 결함을 제거하고 결과 하이브리드 모델의 효율성을 높일 수 있는 잠재력이 있습니다. 이러한 맥락에서 이 새로운 논문은 도시 및 도시 주변 지역의 Ni 농축을 예측하기 위한 최적의 하이브리드 모델을 생성하기 위해 지구 통계와 MLA의 결합 알고리즘을 적용해야 한다고 주장합니다. 이 연구에서는 경험적 베이지안 크리깅(EBK)을 기본 모델로 사용하고 이를 지원 벡터 머신(SVM) 및 다중 선형 회귀(MLR) 모델과 혼합합니다. EBK와 MLA의 하이브리드화는 알려져 있지 않습니다. 보이는 여러 혼합 모델은 일반, 잔차, 회귀 크리깅 및 MLA의 조합입니다. EBK는 공간적 확률 과정을 활용하는 지구 통계적 보간법으로, 필드 전체에 정의된 국소화 매개변수를 사용하여 공간적 변동을 허용합니다. EBK는 농장의 유기 탄소 분포 분석을 포함하여 다양한 연구에 사용되었습니다. 토양40, 토양 오염 평가41 및 토양 특성 매핑42.
반면, 자기 조직화 그래프(SeOM)는 Li et al. 43, Wang et al. 44, Hossain Bhuiyan et al. 45, Kebonye et al. 46과 같은 다양한 논문에서 적용된 학습 알고리즘입니다. 요소의 공간적 속성과 그룹화를 결정합니다. Wang et al. 44는 SeOM이 비선형 문제를 그룹화하고 상상하는 능력으로 알려진 강력한 학습 기술이라고 설명합니다. 주성분 분석, 퍼지 클러스터링, 계층적 클러스터링 및 다중 기준 의사 결정과 같은 다른 패턴 인식 기술과 달리 SeOM은 PTE 패턴을 구성하고 식별하는 데 더 뛰어납니다. Wang et al. 44에 따르면 SeOM은 관련 뉴런의 분포를 공간적으로 그룹화하고 고해상도 데이터 시각화를 제공할 수 있습니다. SeOM은 Ni 예측 데이터를 시각화하여 직접 해석할 수 있는 결과를 특성화하는 최상의 모델을 얻습니다.
이 논문은 도시와 도시 주변 토양의 니켈 함량을 예측하기 위한 최적의 정확도를 가진 강력한 매핑 모델을 생성하는 것을 목표로 합니다.혼합 모델의 신뢰성은 주로 기본 모델에 연결된 다른 모델의 영향에 따라 달라진다고 가정합니다.DSM이 직면한 과제를 인식하고 있으며, 이러한 과제는 여러 측면에서 해결되고 있지만 지구통계학과 MLA 모델의 발전이 점진적으로 결합되는 것으로 보입니다.따라서 혼합 모델을 생성할 수 있는 연구 질문에 답하려고 시도할 것입니다.그러나 이 모델은 대상 요소를 예측하는 데 얼마나 정확합니까?또한 검증 및 정확도 평가를 기반으로 한 효율성 평가 수준은 무엇입니까?따라서 이 연구의 구체적인 목표는 (a) EBK를 기본 모델로 사용하여 SVMR 또는 MLR에 대한 결합 혼합 모델을 생성하는 것, (b) 결과 모델을 비교하는 것, (c) 도시 또는 도시 주변 토양의 Ni 농도를 예측하기 위한 최상의 혼합 모델을 제안하는 것, (d) SeOM을 적용하여 니켈 공간 변화에 대한 고해상도 지도를 생성하는 것입니다.
연구는 체코 공화국, 특히 모라비아-실레시아 지역의 프리데크 미스테크 지구에서 수행되고 있습니다(그림 1 참조). 연구 지역의 지형은 매우 험하고 대부분이 카르파티아 산맥의 외곽에 있는 모라비아-실레시아 베스키디 지역의 일부입니다. 연구 지역은 북위 49° 41′ 0′과 동경 18° 20′ 0′ 사이에 위치하고 고도는 225~327m입니다. 그러나 이 지역의 기후 상태에 대한 쾨펜 분류 체계는 Cfb = 온대 해양성 기후로 평가됩니다. 건조한 달에도 강수량이 많습니다. 기온은 일년 내내 -5°C와 24°C 사이에서 약간씩 변하며 -14°C 아래로 떨어지거나 30°C 위로 올라가는 경우는 드물고 연평균 강수량은 685~752mm입니다. 전체 지역의 추정 조사 면적은 1,208제곱킬로미터이며 경작지의 39.38%와 산림 피복의 49.36%를 차지합니다. 반면 이 연구에서 사용된 면적은 약 889.8제곱킬로미터입니다. 오스트라바와 그 주변 지역에서는 철강 산업과 금속 작업이 매우 활발합니다. 금속 공장, 니켈이 스테인리스강(예: 대기 부식에 대한 저항성)과 합금강(니켈은 합금의 강도를 높이면서 연성과 인성을 유지함)에 사용되는 철강 산업, 그리고 다음과 같은 집약적 농업 인산비료 시용 및 가축 생산은 이 지역의 니켈에 대한 연구 가능한 공급원입니다(예: 어린 양과 저사육 소의 성장률을 높이기 위해 어린 양에게 니켈을 첨가하는 것). 연구 분야에서 니켈의 다른 산업적 활용으로는 전기도금, 즉 전기도금 니켈 및 무전해 니켈 도금 공정에서의 사용이 있습니다. 토양 특성은 토양 색상, 구조 및 탄산염 함량을 통해 쉽게 구분할 수 있습니다. 토양 질감은 중간에서 미세하며 모재에서 유래합니다. 이들은 본질적으로 충적, 퇴적 또는 풍성입니다. 일부 토양 지역은 표면과 심토에 얼룩덜룩하게 보이며 종종 콘크리트와 표백이 있습니다. 그러나 캄비졸과 스타그노졸이 이 지역에서 가장 흔한 토양 유형입니다48. 체코 공화국의 고도는 455.1m에서 493.5m 사이이며 캄비졸이 우세합니다49.
연구 지역 지도 [연구 지역 지도는 ArcGIS Desktop(ESRI, Inc, 버전 10.7, URL: https://desktop.arcgis.com)을 사용하여 생성되었습니다.]
Frydek Mistek 지역의 도시 및 도시 주변 토양에서 총 115개의 표토 샘플을 채취했습니다. 사용된 샘플 패턴은 토양 샘플을 2 x 2km 간격으로 규칙적으로 배치한 격자였으며, 휴대용 GPS 장치(Leica Zeno 5 GPS)를 사용하여 0~20cm 깊이에서 표토를 측정했습니다. 샘플은 Ziploc 백에 포장하고 적절한 라벨을 붙인 후 실험실로 배송했습니다. 샘플은 공기 건조하여 분쇄된 샘플을 만들고, 기계식 시스템(Fritsch 디스크 밀)으로 분쇄한 후 체질했습니다(체 크기 2mm). 건조, 균질화 및 체질한 토양 샘플 1g을 명확하게 라벨이 붙은 테프론 병에 담았습니다. 각 테프론 용기에 35% HCl 7ml와 65% HNO3 3ml를 분주했습니다(각 산에 대해 하나씩 자동 분배기를 사용). 가볍게 덮고 반응이 일어날 때까지 샘플을 하룻밤 동안 방치했습니다(왕수 프로그램). .상층액을 뜨거운 금속판(온도: 100W 및 160°C)에 2시간 동안 놓아 샘플의 소화 과정을 용이하게 한 다음 식힙니다.상층액을 50ml 용량 플라스크로 옮기고 탈이온수로 50ml로 희석합니다.그런 다음 희석된 상층액을 탈이온수가 있는 50ml PVC 튜브에 여과합니다.또한 희석 용액 1ml를 탈이온수 9ml로 희석하고 PTE 의사 농축을 위해 준비한 12ml 튜브에 여과합니다.PTE(As, Cd, Cr, Cu, Mn, Ni, Pb, Zn, Ca, Mg, K)의 농도는 표준 방법 및 계약에 따라 ICP-OES(Inductively Coupled Plasma Optical Emission Spectroscopy)(Thermo Fisher Scientific, USA)를 통해 결정했습니다.품질 보증 및 관리(QA/QC) 절차(SRM NIST)를 보장합니다. 2711a Montana II 토양).검출 한계가 절반 이하인 PTE는 이 연구에서 제외되었습니다.이 연구에서 사용된 PTE의 검출 한계는 0.0004(you)였습니다.또한, 각 분석에 대한 품질 관리 및 품질 보증 프로세스는 기준 표준을 분석하여 보장됩니다.오류를 최소화하기 위해 이중 분석을 수행했습니다.
경험적 베이지안 크리깅(EBK)은 토양 과학과 같은 다양한 분야의 모델링에 사용되는 많은 지구통계적 보간 기술 중 하나입니다. 다른 크리깅 보간 기술과 달리 EBK는 반변이도 모델에서 추정된 오차를 고려한다는 점에서 기존 크리깅 방법과 다릅니다. EBK 보간에서는 단일 반변이도 대신 여러 반변이도 모델이 보간 중에 계산됩니다. 보간 기술은 충분한 크리깅 방법의 매우 복잡한 부분을 구성하는 반변이도의 플로팅과 관련된 불확실성과 프로그래밍을 대체합니다. EBK의 보간 프로세스는 Krivoruchko50이 제안한 세 가지 기준을 따릅니다. (a) 모델은 입력 데이터 세트에서 반변이도를 추정합니다. (b) 생성된 반변이도를 기반으로 각 입력 데이터 세트 위치에 대한 새로운 예측 값입니다. (c) 최종 A 모델은 시뮬레이션된 데이터 세트에서 계산됩니다. 베이지안 방정식 규칙은 사후 확률로 제공됩니다.
여기서 \(Prob\left(A\right)\)는 사전 확률을 나타내고, \(Prob\left(B\right)\)의 주변 확률은 대부분의 경우 무시됩니다. \(Prob (B,A)\ ) 반변이도 계산은 반변이도에서 생성할 수 있는 관측 데이터 집합의 경향을 보여주는 베이즈 규칙을 기반으로 합니다. 반변이도의 값은 반변이도에서 관측 데이터 집합을 생성할 가능성을 나타내는 베이즈 규칙을 사용하여 결정됩니다.
지원 벡터 머신은 동일하지만 선형적으로 독립적이지 않은 클래스를 구별하기 위해 최적의 분리 초평면을 생성하는 머신 러닝 알고리즘입니다.Vapnik51은 의도 분류 알고리즘을 만들었지만 최근에는 회귀 지향 문제를 해결하는 데 사용되었습니다.Li et al.52에 따르면 SVM은 최고의 분류기 기술 중 하나이며 다양한 분야에서 사용되었습니다.이 분석에서는 SVM의 회귀 구성 요소(지원 벡터 머신 회귀 - SVMR)를 사용했습니다.Cherkassky와 Mulier53은 다국가 공간 함수가 있는 선형 회귀 모델을 사용하여 계산을 수행한 커널 기반 회귀로 SVMR을 개척했습니다.John et al.54는 SVMR 모델링이 비선형 관계를 만들고 공간 함수를 허용하는 초평면 선형 회귀를 사용한다고 보고했습니다.Vohland et al. 55, 엡실론(ε)-SVMR은 훈련된 데이터 세트를 사용하여 엡실론에 민감하지 않은 함수로 표현 모델을 얻고, 이 함수는 상관 관계가 있는 데이터에 대한 훈련에서 가장 좋은 엡실론 편향을 사용하여 데이터를 독립적으로 매핑하는 데 적용됩니다. 사전 설정된 거리 오차는 실제 값에서 무시되고, 오차가 ε(ε)보다 크면 토양 속성이 이를 보상합니다. 또한 이 모델은 훈련 데이터의 복잡성을 더 광범위한 지원 벡터 하위 집합으로 줄입니다. Vapnik51이 제안한 방정식은 아래와 같습니다.
여기서 b는 스칼라 임계값을 나타내고, \(K\left({x}_{,}{ x}_{k}\right)\)는 커널 함수를 나타내고, \(\alpha\)는 라그랑주 승수를 나타내고, N은 수치 데이터 세트를 나타내고, \({x}_{k}\)는 데이터 입력을 나타내고, \(y\)는 데이터 출력을 나타냅니다. 사용되는 주요 커널 중 하나는 가우시안 방사형 기저 함수(RBF)인 SVMR 연산입니다. RBF 커널은 최적의 SVMR 모델을 결정하는 데 적용되며, 이는 PTE 학습 데이터에 대한 가장 미묘한 페널티 세트 인자 C와 커널 매개변수 감마(γ)를 얻는 데 중요합니다. 먼저 학습 세트를 평가한 다음 검증 세트에서 모델 성능을 테스트했습니다. 사용된 스티어링 매개변수는 시그마이고 방법 값은 svmRadial입니다.
다중선형회귀모형(MLR)은 최소제곱법을 이용하여 계산된 선형 풀링 매개변수를 이용하여 반응변수와 여러 예측변수 간의 관계를 나타내는 회귀모형이다.MLR에서 최소제곱모형은 설명변수를 선정한 후 토양의 특성을 예측하는 함수이다.설명변수를 이용하여 선형관계를 설정하기 위해서는 반응변수를 이용해야 한다.설명변수와 선형관계를 설정하기 위해 반응변수로 PTE를 사용하였다.MLR방정식은 다음과 같다.
여기서 y는 반응 변수, \(a\)는 절편, n은 예측 변수의 개수, \({b}_{1}\)은 계수의 부분 회귀, \({x}_{ i}\)는 예측 변수 또는 설명 변수를 나타내고, \({\varepsilon }_{i}\)는 모델의 오차(잔차라고도 함)를 나타냅니다.
혼합 모델은 EBK를 SVMR 및 MLR로 샌드위치하여 얻었습니다.이는 EBK 보간에서 예측 값을 추출하여 수행됩니다.보간된 Ca, K 및 Mg에서 얻은 예측 값은 CaK, CaMg 및 KMg와 같은 새로운 변수를 얻기 위해 조합 프로세스를 통해 얻습니다.그런 다음 Ca, K 및 Mg 원소를 결합하여 네 번째 변수인 CaKMg를 얻습니다.전반적으로 얻은 변수는 Ca, K, Mg, CaK, CaMg, KMg 및 CaKMg입니다.이러한 변수는 도시 및 도시 주변 토양의 니켈 농도를 예측하는 데 도움이 되는 예측 변수가 되었습니다.혼합 모델 경험적 베이지안 크리깅-지원 벡터 머신(EBK_SVM)을 얻기 위해 예측 변수에 SVMR 알고리즘을 수행했습니다.마찬가지로 변수는 MLR 알고리즘을 통해 파이프되어 혼합 모델 경험적 베이지안 크리깅-다중 선형 회귀(EBK_MLR)를 얻습니다.일반적으로 변수 Ca, K, Mg, CaK, CaMg, KMg, CaKMg는 도시 및 도시 주변 토양의 Ni 함량을 예측하는 공변량으로 사용됩니다. 얻어진 가장 수용 가능한 모델(EBK_SVM 또는 EBK_MLR)은 자기 조직화 그래프를 사용하여 시각화됩니다. 이 연구의 워크플로는 그림 2에 나와 있습니다.
SeOM은 금융, 의료, 산업, 통계, 토양 과학 등 여러 분야에서 데이터를 정리, 평가, 예측하는 데 널리 사용되는 도구입니다. SeOM은 인공 신경망과 비지도 학습 방법을 사용하여 정리, 평가, 예측을 위해 만들어졌습니다. 이 연구에서는 SeOM을 사용하여 도시와 도시 주변 토양의 Ni 예측에 가장 적합한 모델을 기반으로 Ni 농도를 시각화했습니다. SeOM 평가에서 처리되는 데이터는 n개의 입력 차원 벡터 변수43,56으로 사용됩니다. Melssen et al. 57은 단일 입력 레이어를 통해 입력 벡터를 신경망에 연결하고 단일 가중치 벡터를 갖는 출력 벡터에 연결하는 방법을 설명합니다. SeOM에서 생성된 출력은 근접성에 따라 육각형, 원형 또는 정사각형 토폴로지 맵으로 짜여진 다양한 뉴런 또는 노드로 구성된 2차원 맵입니다. 미터법, 양자화 오차(QE) 및 지형 오차(TE)를 기준으로 맵 크기를 비교한 결과, 각각 0.086과 0.904인 SeOM 모델이 선택되었으며, 이는 55개 맵 단위(5 × 11)입니다. 뉴런 구조는 경험적 방정식의 노드 수에 따라 결정됩니다.
이 연구에 사용된 데이터 수는 115개 샘플입니다.무작위 접근 방식을 사용하여 데이터를 테스트 데이터(검증용 25%)와 학습 데이터 세트(보정용 75%)로 분할했습니다.학습 데이터 세트는 회귀 모델(보정)을 생성하는 데 사용되고, 테스트 데이터 세트는 일반화 능력을 확인하는 데 사용됩니다58.이것은 토양의 니켈 함량을 예측하는 다양한 모델의 적합성을 평가하기 위해 수행되었습니다.사용된 모든 모델은 10겹 교차 검증 프로세스를 거쳤으며, 이를 5번 반복했습니다.EBK 보간으로 생성된 변수는 대상 변수(PTE)를 예측하는 예측 변수 또는 설명 변수로 사용됩니다.모델링은 library(Kohonen), library(caret), library(modelr), library("e1071"), library("plyr"), library("caTools"), library("spectr") 및 libraries("Metrics") 패키지를 사용하여 RStudio에서 처리합니다.
다양한 검증 매개변수를 사용하여 토양의 니켈 농도 예측에 적합한 최상의 모델을 결정하고 모델의 정확성과 검증을 평가했습니다.혼성화 모델은 평균 절대 오차(MAE), 평균 제곱근 오차(RMSE), R 제곱 또는 계수 결정(R2)을 사용하여 평가했습니다.R2는 회귀 모델로 표현된 답의 비율의 분산을 정의합니다.RMSE와 독립 측정의 분산 크기는 모델의 예측력을 설명하는 반면 MAE는 실제 정량적 값을 결정합니다.검증 매개변수를 사용하여 최상의 혼합 모델을 평가하려면 R2 값이 높아야 하며 값이 1에 가까울수록 정확도가 높습니다.Li et al. 59에 따르면 0.75 이상의 R2 기준 값은 좋은 예측 변수로 간주됩니다. 0.5~0.75는 수용 가능한 모델 성능이고, 0.5 미만은 수용 불가능한 모델 성능입니다. RMSE와 MAE 검증 기준 평가 방법을 사용하여 모델을 선택할 때, 낮은 값이 얻어지면 충분하며 가장 좋은 선택으로 간주되었습니다. 다음 방정식은 검증 방법을 설명합니다.
여기서 n은 관찰된 값의 크기를 나타내고, \({Y}_{i}\)는 측정된 반응을 나타내며, \({\widehat{Y}}_{i}\)는 또한 첫 번째 i개 관찰에 대한 예측된 반응 값을 나타냅니다.
예측 변수와 반응 변수의 통계적 설명은 평균, 표준 편차(SD), 변동 계수(CV), 최소값, 최대값, 첨도 및 왜도를 보여주는 표 1에 제시되어 있습니다. 원소의 최소값과 최대값은 각각 Mg < Ca < K < Ni 및 Ca < Mg < K < Ni의 감소 순서입니다. 연구 지역에서 샘플링된 반응 변수(Ni)의 농도는 4.86~42.39mg/kg 범위였습니다. Ni를 세계 평균(29mg/kg) 및 유럽 평균(37mg/kg)과 비교한 결과 연구 지역의 전체 계산된 기하 평균이 허용 범위 내에 있음을 보여주었습니다. 그럼에도 불구하고 Kabata-Pendias11에서 보여준 것처럼 현재 연구에서 평균 니켈(Ni) 농도를 스웨덴의 농업 토양과 비교한 결과 현재 평균 니켈 농도가 더 높은 것으로 나타났습니다. 마찬가지로 현재 도시 및 도시 주변 토양의 Frydek Mistek의 평균 농도 연구(Ni 16.15 mg/kg)는 Różański et al.에서 보고한 폴란드 도시 토양의 Ni 허용 한계인 60(10.2 mg/kg)보다 높았습니다.또한 Bretzel과 Calderisi61은 현재 연구에 비해 토스카나의 도시 토양에서 매우 낮은 평균 Ni 농도(1.78 mg/kg)를 기록했습니다.Jim62는 또한 홍콩 도시 토양에서 더 낮은 니켈 농도(12.34 mg/kg)를 발견했는데, 이는 이 연구에서의 현재 니켈 농도보다 낮습니다.Birke et al63은 독일 작센안할트의 오래된 광산 및 도시 산업 지역에서 평균 Ni 농도가 17.6 mg/kg이라고 보고했는데, 이는 해당 지역의 평균 Ni 농도(16.15 mg/kg)보다 1.45 mg/kg 더 높았습니다.현재 연구.연구 지역의 일부 도시 및 교외 지역의 토양에서 과도한 니켈 함량은 주로 철강 산업과 금속 산업에 기인할 수 있습니다.이것은 영어: 이는 철강 산업과 금속 가공이 토양의 니켈 오염의 주요 원인이라는 Khodadoust et al. 64의 연구와 일치합니다. 그러나 예측 인자는 Ca의 경우 538.70mg/kg~69,161.80mg/kg, K의 경우 497.51mg/kg~3535.68mg/kg, Mg의 경우 685.68mg/kg~5970.05mg/kg의 범위였습니다. Jakovljevic et al. 65는 세르비아 중부의 토양에서 총 Mg와 K 함량을 조사했습니다. 그들은 총 농도(각각 410mg/kg 및 400mg/kg)가 현재 연구에서의 Mg와 K 농도보다 낮다는 것을 발견했습니다. 구별할 수 없게도 폴란드 동부에서 Orzechowski와 Smolczynski66는 Ca, Mg 및 K의 총 함량을 평가하여 Ca(1100mg/kg), Mg(590mg/kg) 및 K(810mg/kg)의 평균 농도를 보였습니다. 표토의 함량은 이 연구에서 단일 원소보다 낮습니다. Pongrac 등이 실시한 최근 연구에 따르면 67 스코틀랜드와 영국의 3가지 다른 토양(Mylnefield 토양, Balruddery 토양 및 Hartwood 토양)에서 분석한 총 Ca 함량은 이 연구에서 더 높은 Ca 함량을 나타냈습니다.
샘플링된 원소의 측정 농도가 다르기 때문에 원소의 데이터 세트 분포는 서로 다른 왜도를 보입니다. 원소의 왜도와 첨도는 각각 1.53~7.24와 2.49~54.16의 범위였습니다. 계산된 모든 원소는 왜도와 첨도 수준이 +1보다 높아 데이터 분포가 불규칙하고 오른쪽 방향으로 치우쳐 있으며 정점을 이루고 있음을 나타냅니다. 원소의 추정 변이계수(CV)는 K, Mg, Ni가 적당한 변동성을 보이는 반면 Ca는 매우 높은 변동성을 보임을 보여줍니다. K, Ni, Mg의 변이계수는 이들의 균일한 분포를 설명합니다. 나아가 Ca 분포는 균일하지 않으며 외부 소스가 농축 수준에 영향을 미칠 수 있습니다.
예측 변수와 반응 요소의 상관관계는 요소 간에 만족스러운 상관관계가 있음을 나타냅니다(그림 3 참조). 상관관계는 CaK가 CaNi와 마찬가지로 r 값 = 0.53으로 적당한 상관관계를 보였음을 나타냅니다. Ca와 K는 서로 적당한 연관성을 보이지만 Kingston et al.과 같은 연구자들은 68과 Santo69는 토양에서의 수준이 반비례한다고 제안합니다.그러나 Ca와 Mg는 K에 길항적이지만 CaK는 상관관계가 좋습니다.이는 칼륨이 56% 더 높은 탄산칼륨과 같은 비료를 적용했기 때문일 수 있습니다.칼륨은 마그네슘과 적당한 상관관계를 보였습니다(KM r = 0.63).비료 산업에서 이 두 원소는 황산칼륨 마그네슘, 질산칼륨 마그네슘, 칼륨이 토양에 적용되어 결핍 수준을 높이기 때문에 밀접한 관련이 있습니다.니켈은 Ca, K, Mg와 적당한 상관관계를 보이며 각각 r 값은 0.52, 0.63, 0.55입니다.칼슘, 마그네슘, 니켈과 같은 PTE가 관련된 관계는 복잡하지만 그럼에도 불구하고 마그네슘은 칼슘 흡수를 억제하고 칼슘은 과도한 마그네슘의 영향을 줄이며 마그네슘과 칼슘은 모두 토양에서 니켈의 독성 효과를 줄입니다.
예측 변수와 응답 변수 간의 관계를 보여주는 요소에 대한 상관 행렬(참고: 이 그림에는 요소 간의 산점도가 포함되어 있으며, 유의 수준은 p < 0,001을 기준으로 함).
그림 4는 원소의 공간 분포를 보여줍니다.Burgos et al70에 따르면, 공간 분포의 적용은 오염된 지역의 핫스팟을 정량화하고 강조하는 데 사용되는 기술입니다.그림 4에서 Ca의 농축 수준은 공간 분포 지도의 북서쪽 부분에서 볼 수 있습니다.그림은 중간에서 높은 Ca 농축 핫스팟을 보여줍니다.지도 북서쪽의 칼슘 농축은 토양 산성도를 낮추기 위해 생석회(산화칼슘)를 사용하고 제강 공정에서 알칼리성 산소로 제철소에서 사용하기 때문일 가능성이 높습니다.반면에 다른 농부들은 산성 토양에서 pH를 중화하기 위해 수산화칼슘을 사용하는 것을 선호하는데, 이는 토양의 칼슘 함량을 증가시키기도 합니다71.칼륨 또한 지도의 북서쪽과 동쪽에서 핫스팟을 보여줍니다.북서부는 주요 농업 지역이며, 칼륨의 중간에서 높은 패턴은 NPK와 칼륨 시용 때문일 수 있습니다.이는 Madaras와 Lipavský72, Madaras et al.73과 같은 다른 연구와 일치합니다. al.73, Pulkrabová et al.74, Asare et al.75는 토양 안정화 및 KCl과 NPK 처리가 토양 내 칼륨 함량을 높이는 것으로 관찰했습니다. 분포도 북서쪽의 공간적 칼륨 농축은 염화칼륨, 황산칼륨, 질산칼륨, 칼륨, 그리고 척박한 토양의 칼륨 함량을 높이기 위해 칼륨 기반 비료를 사용했기 때문일 수 있습니다. Zádorová et al.76 및 Tlustoš et al. 77에서는 K 기반 비료를 사용하면 토양의 K 함량이 증가하고 장기적으로 토양 영양소 함량이 크게 증가할 것이라고 설명했습니다. 특히 K와 Mg의 경우 토양에서 핫스팟이 나타났습니다. 지도의 북서쪽과 남동쪽에 비교적 적당한 핫스팟이 있습니다. 토양의 콜로이드 고정은 토양의 마그네슘 농도를 고갈시킵니다. 토양에 마그네슘이 부족하면 식물에 황색을 띠는 잎맥간 엽록소 결핍증이 나타납니다. 황산마그네슘칼륨, 황산마그네슘, 키저라이트와 같은 마그네슘 기반 비료는 정상 pH 범위6의 토양에서 결핍증(식물이 보라색, 빨간색 또는 갈색으로 변하여 마그네슘 결핍을 나타냄)을 치료합니다. 도시와 도시 주변 토양 표면에 니켈이 축적되는 것은 농업과 같은 인위적인 활동과 스테인리스 스틸 생산에 니켈이 중요한 역할을 하기 때문일 수 있습니다.
요소의 공간 분포 [공간 분포 맵은 ArcGIS Desktop(ESRI, Inc, 버전 10.7, URL: https://desktop.arcgis.com)을 사용하여 생성되었습니다.]
이 연구에서 사용된 원소에 대한 모델 성능 지수 결과는 표 2에 나와 있습니다. 반면 Ni의 RMSE와 MAE는 모두 0에 가깝습니다(0.86 RMSE, -0.08 MAE). 반면 K의 RMSE와 MAE 값은 모두 허용 가능합니다. 칼슘과 마그네슘의 RMSE와 MAE 결과가 더 컸습니다. Ca와 K의 MAE와 RMSE 결과가 다른 데이터 세트로 인해 더 큽니다. EBK를 사용하여 Ni를 예측하는 이 연구의 RMSE와 MAE는 동일한 수집된 데이터를 사용하여 토양의 S 농도를 예측하기 위해 시너지 크리깅을 사용하는 John et al. 54의 결과보다 더 나은 것으로 나타났습니다. 우리가 연구한 EBK 출력은 Fabijaczyk et al. 41, Yan et al. 79, Beguin et al. 80, Adhikary et al. 81 및 John et al. 82의 출력, 특히 K와 Ni와 상관 관계가 있습니다.
도시 및 도시 주변 토양의 니켈 함량을 예측하기 위한 개별 방법의 성능은 모델의 성능을 사용하여 평가되었습니다(표 3).모델 검증 및 정확도 평가는 Ca_Mg_K 예측기를 EBK SVMR 모델과 결합했을 때 가장 좋은 성능을 낸다는 것을 확인했습니다.교정 모델 Ca_Mg_K-EBK_SVMR 모델 R2, 평균 제곱근 오차(RMSE) 및 평균 절대 오차(MAE)는 0.637(R2), 95.479 mg/kg(RMSE) 및 77.368 mg/kg(MAE)이었습니다.Ca_Mg_K-SVMR은 0.663(R2), 235.974 mg/kg(RMSE) 및 166.946 mg/kg(MAE)이었습니다.그럼에도 불구하고 Ca_Mg_K-SVMR(0.663 mg/kg R2) 및 Ca_Mg-EBK_SVMR에 대해 좋은 R2 값이 얻어졌습니다. (0.643 = R2); 그들의 RMSE 및 MAE 결과는 Ca_Mg_K-EBK_SVMR(R2 0.637)의 결과보다 높았습니다(표 3 참조).또한 Ca_Mg-EBK_SVMR(RMSE = 1664.64 및 MAE = 1031.49) 모델의 RMSE 및 MAE는 각각 17.5 및 13.4로 Ca_Mg_K-EBK_SVMR보다 큽니다.마찬가지로 Ca_Mg-K SVMR(RMSE = 235.974 및 MAE = 166.946) 모델의 RMSE 및 MAE는 각각 Ca_Mg_K-EBK_SVMR RMSE 및 MAE보다 2.5 및 2.2 더 큽니다.계산된 RMSE 결과는 데이터 세트가 최적선에 얼마나 집중되어 있는지를 나타냅니다.더 높은 RSME 및 MAE는 관찰됨.Kebonye et al. 46 및 john et al. 54에 따르면 RMSE와 MAE가 0에 가까울수록 결과가 더 좋습니다.SVMR과 EBK_SVMR은 양자화된 RSME 및 MAE 값이 더 높습니다.RSME 추정치가 MAE 값보다 지속적으로 높은 것으로 관찰되었는데, 이는 이상치가 존재함을 나타냅니다.Legates 및 McCabe83에 따르면 RMSE가 평균 절대 오차(MAE)를 초과하는 정도는 이상치 존재의 지표로 권장됩니다.즉, 데이터 세트의 이질성이 높을수록 MAE 및 RMSE 값이 높아집니다.도시와 교외 토양의 Ni 함량을 예측하기 위한 Ca_Mg_K-EBK_SVMR 혼합 모델의 교차 검증 평가 정확도는 63.70%였습니다.Li et al. 59에 따르면 이 정확도 수준은 허용 가능한 모델 성능 비율입니다.현재 결과는 Tarasov et al.의 이전 연구와 비교됩니다. 36은 하이브리드 모델로 MLPRK(Multilayer Perceptron Residual Kriging)를 생성하였으며, 본 연구에서 보고된 EBK_SVMR 정확도 평가 지수와 관련하여 RMSE(210) 및 MAE(167.5)가 본 연구에서의 결과(RMSE 95.479, MAE 77.368)보다 높았습니다. 그러나 본 연구의 R2(0.637)를 Tarasov et al.의 R2와 비교했을 때, 36(0.544), 이 혼합 모델에서 결정 계수(R2)가 더 높다는 것이 분명합니다.혼합 모델의 오차 한계(RMSE 및 MAE)(EBK SVMR)는 두 배 더 낮습니다.마찬가지로, Sergeev et al.34는 개발된 하이브리드 모델(다층 퍼셉트론 잔차 크리깅)에 대해 0.28(R2)을 기록한 반면, 본 연구에서 Ni는 0.637(R2)을 기록했습니다.이 모델(EBK SVMR)의 예측 정확도 수준은 63.7%인 반면, Sergeev et al.34가 얻은 예측 정확도는 28%입니다.EBK_SVMR 모델과 Ca_Mg_K를 예측 변수로 사용하여 만든 최종 맵(그림 5)은 전체 연구 지역에서 핫스팟과 중간에서 니켈에 대한 예측을 보여줍니다.이는 연구 지역의 니켈 농도가 주로 중간이며 일부 특정 지역에서 농도가 더 높다는 것을 의미합니다.
최종 예측 맵은 하이브리드 모델 EBK_SVMR을 사용하여 표현되었으며, Ca_Mg_K를 예측 변수로 사용했습니다.[공간 분포 맵은 RStudio(버전 1.4.1717: https://www.rstudio.com/)를 사용하여 생성되었습니다.]
그림 6은 개별 뉴런으로 구성된 구성 평면으로서 PTE 농도를 나타낸다. 구성 평면 중 어느 것도 표시된 것과 동일한 색상 패턴을 나타내지 않았다. 그러나 그려진 맵당 적절한 뉴런 수는 55개이다. SeOM은 다양한 색상을 사용하여 생성되며 색상 패턴이 유사할수록 샘플의 속성도 더 유사해진다. 정확한 색상 척도에 따르면 개별 원소(Ca, K, Mg)는 단일 고차 뉴런 및 대부분의 저차 뉴런과 유사한 색상 패턴을 보였다. 따라서 CaK와 CaMg는 매우 고차 뉴런 및 저차에서 중차 색상 패턴과 일부 유사성을 공유한다. 두 모델 모두 빨간색, 주황색, 노란색과 같은 중간에서 높은 색조의 색상을 표시하여 토양의 Ni 농도를 예측한다. KMg 모델은 정확한 비율과 낮음에서 중간 색상 패치를 기반으로 많은 높은 색상 패턴을 표시한다. 낮은 것에서 높은 것까지의 정확한 색상 척도에서 모델 구성 요소의 평면 분포 패턴은 토양의 잠재적 니켈 농도를 나타내는 높은 색상 패턴을 보였다(그림 4 참조). CakMg 모델 구성 요소 평면은 정확한 색상 척도에 따라 낮은 것부터 높은 것까지 다양한 색상 패턴을 나타냅니다.또한 모델의 니켈 함량(CakMg) 예측은 그림 5에 표시된 니켈의 공간 분포와 유사합니다.두 그래프 모두 도시와 도시 주변 토양의 니켈 농도가 높은 비율, 중간 비율, 낮은 비율을 보여줍니다.그림 7은 각 모델의 예측값을 기준으로 세 개의 클러스터로 나뉜 지도의 k-평균 그룹화에서 등고선 방법을 보여줍니다.등고선 방법은 최적의 클러스터 수를 나타냅니다.수집된 115개의 토양 샘플 중 범주 1이 74개로 가장 많은 토양 샘플을 얻었습니다.클러스터 2는 33개의 샘플을 받았고, 클러스터 3은 8개의 샘플을 받았습니다.7가지 구성 요소 평면 예측 변수 조합은 정확한 클러스터 해석을 허용하기 위해 단순화되었습니다.토양 형성에 영향을 미치는 수많은 인위적 및 자연적 과정으로 인해 분산된 SeOM 지도에서 클러스터 패턴을 적절하게 구분하는 것이 어렵습니다.
각 경험적 베이지안 크리깅 지원 벡터 머신(EBK_SVM_SeOM) 변수에 의한 구성 요소 평면 출력.[SeOM 맵은 RStudio(버전 1.4.1717: https://www.rstudio.com/)를 사용하여 생성되었습니다.]
다양한 클러스터 분류 구성 요소[SeOM 맵은 RStudio(버전 1.4.1717: https://www.rstudio.com/)를 사용하여 생성되었습니다.]
현재 연구는 도시 및 도시 주변 토양의 니켈 농도에 대한 모델링 기술을 명확하게 설명합니다. 이 연구는 토양의 니켈 농도를 예측하는 가장 좋은 방법을 얻기 위해 요소와 모델링 기술을 결합하는 다양한 모델링 기술을 테스트했습니다. 모델링 기술의 SeOM 구성 평면 공간 특징은 정확한 색상 척도에서 낮은 것에서 높은 것까지 높은 색상 패턴을 나타내어 토양의 Ni 농도를 나타냅니다. 그러나 공간 분포 맵은 EBK_SVMR에서 나타난 성분의 평면 공간 분포를 확인합니다(그림 5 참조). 결과에 따르면 지원 벡터 머신 회귀 모델(Ca Mg K-SVMR)은 단일 모델로 토양의 Ni 농도를 예측하지만 검증 및 정확도 평가 매개변수는 RMSE 및 MAE 측면에서 매우 높은 오류를 나타냅니다. 반면 EBK_MLR 모델에 사용된 모델링 기술은 결정 계수(R2) 값이 낮기 때문에 결함이 있습니다. EBK SVMR과 결합된 요소(CaKMg)를 사용하여 낮은 RMSE 및 MAE 오류로 좋은 결과를 얻었습니다. 정확도는 63.7%입니다.EBK 알고리즘을 머신 러닝 알고리즘과 결합하면 토양의 PTE 농도를 예측할 수 있는 하이브리드 알고리즘을 생성할 수 있는 것으로 나타났습니다.연구 결과에 따르면 Ca Mg K를 예측 인자로 사용하여 연구 지역의 Ni 농도를 예측하면 토양의 Ni 예측을 개선할 수 있습니다.이는 니켈 기반 비료의 지속적인 사용과 철강 산업에 의한 토양의 산업 오염이 토양의 니켈 농도를 증가시키는 경향이 있음을 의미합니다.이 연구에서는 EBK 모델이 오차 수준을 줄이고 도시 또는 도시 주변 토양의 토양 공간 분포 모델 정확도를 개선할 수 있음을 밝혔습니다.일반적으로 EBK-SVMR 모델을 적용하여 토양의 PTE를 평가하고 예측할 것을 제안합니다.또한 EBK를 사용하여 다양한 머신 러닝 알고리즘과 하이브리드화할 것을 제안합니다.Ni 농도는 공변량으로 요소를 사용하여 예측했습니다. 그러나 더 많은 공변량을 사용하면 모델의 성능이 크게 향상될 수 있는데, 이는 현재 연구의 한계로 간주될 수 있습니다. 이 연구의 또 다른 한계는 데이터 세트의 수가 115개라는 것입니다. 따라서 더 많은 데이터가 제공되면 제안된 최적화된 하이브리디제이션 방법의 성능이 향상될 수 있습니다.
PlantProbs.net.식물과 토양의 니켈 https://plantprobs.net/plant/nutrientImbalances/sodium.html (2021년 4월 28일 접속).
Kasprzak, KS 니켈은 현대 환경 독성학의 발전.주변 환경 독성학.11, 145–183(1987).
Cempel, M. & Nikel, G. 니켈: 출처 및 환경 독성학에 대한 검토.Polish J. Environment.Stud.15, 375–382(2006).
Freedman, B. & Hutchinson, TC 캐나다 온타리오주 서드베리에 있는 니켈-구리 제련소 근처 토양 및 식물에 축적된 대기 오염 물질.can.J. Bot.58(1), 108-132.https://doi.org/10.1139/b80-014 (1980).
Manyiwa, T. et al. 보츠와나의 Selebi-Phikwe 구리-니켈 광산 근처 토양, 식물 및 방목 반추동물과 관련된 위험.주변.지구화학.건강 https://doi.org/10.1007/s10653-021-00918-x (2021).
Cabata-Pendias.Kabata-Pendias A. 2011. 토양 및…의 미량 원소 – Google 학술 검색 https://scholar.google.com/scholar?hl=en&as_sdt=0%2C5&q=Kabata-Pendias+A.+2011.+Trace+ Elements+in+soils+and+plants.+4th+ed.+New+York+%28NY%29%3A+CRC+Press&btnG= (2020년 11월 24일 접속).
Almås, A., Singh, B., 농업, TS-NJ of & 1995, 정의되지 않음.노르웨이 Soer-Varanger의 농경 토양 및 풀의 중금속 농도에 미치는 러시아 니켈 산업의 영향.agris.fao.org.
Nielsen, GD et al. 음용수의 니켈 흡수 및 보유는 음식 섭취 및 니켈 민감성과 관련이 있습니다. 독성학. 응용. 약력학. 154, 67–75(1999).
Costa, M. & Klein, CB 니켈 발암, 돌연변이, 유전학 또는 선택.주변 환경.건강 관점.107, 2(1999).
Ajman, PC; Ajado, SK; Borůvka, L.; Bini, JKM; Sarkody, VYO; Cobonye, NM; 잠재적으로 독성이 있는 원소의 추세 분석: 서지학적 검토. 환경 지구화학 및 건강. Springer Science & Business Media BV 2020.https://doi.org/10.1007/s10653-020-00742-9.
Minasny, B. & McBratney, AB 디지털 토양 매핑: 간략한 역사와 몇 가지 교훈.Geoderma 264, 301–311.https://doi.org/10.1016/j.geoderma.2015.07.017 (2016).
McBratney, AB, Mendonça Santos, ML & Minasny, B. 디지털 토양 매핑.Geoderma 117(1-2), 3-52.https://doi.org/10.1016/S0016-7061(03)00223-4 (2003).
Deutsch.CV 지구통계적 저수지 모델링,… – Google 학술 검색 https://scholar.google.com/scholar?hl=en&as_sdt=0%2C5&q=CV+Deutsch%2C+2002%2C+Geostatistical+Reservoir+Modeling%2C +Oxford+University+Press%2C+376+pages.+&btnG= (2021년 4월 28일 접속).

게시 시간: 2022년 7월 22일

혼합 경험적 베이지안 크리깅 및 지원 벡터 머신 회귀를 이용한 교외 및 도시 토양의 니켈 농도 예측

핸드폰

전화

이메일

이메일

왓츠앱

왓츠앱

위챗

위챗

맨 위