Predicția concentrațiilor de nichel în solurile suburbane și urbane folosind Kriging Bayesian empiric mixt și regresia mașină vectorială de sprijin

Vă mulțumim că vizitați Nature.com.Versiunea de browser pe care o utilizați are suport limitat pentru CSS. Pentru cea mai bună experiență, vă recomandăm să utilizați un browser actualizat (sau să dezactivați modul de compatibilitate în Internet Explorer). Între timp, pentru a asigura suport continuu, vom afișa site-ul fără stiluri și JavaScript.
Poluarea solului este o mare problemă cauzată de activitățile umane. Distribuția spațială a elementelor potențial toxice (PTE) variază în majoritatea zonelor urbane și periurbane. Prin urmare, este dificil de prezis spațial conținutul de PTE în astfel de soluri. Un total de 115 probe au fost obținute de la Frydek Mistek în Republica Cehă. Spectrometria de emisie cu plasmă cuplată inductiv. Variabila de răspuns este Ni, iar predictorii sunt Ca, Mg și K. Matricea de corelație dintre variabila răspuns și variabila predictor arată o corelație satisfăcătoare între elemente. Rezultatele predicției au arătat că regresia mașină a vectorului suport (SVMR) a funcționat bine, deși eroarea pătratică medie estimată (RMSE) (235,976 mg/kg) (Eroare absolută) (235,976 mg/kg) au fost mai mari decât celelalte metode aplicate. Modelele mixte pentru regresia liniară multiplă empirică Bayesian (EBK-MLR) au rezultate slabe, după cum evidențiază coeficienții de determinare mai mici de 0,1. Modelul empiric Bayesian Kriging-Support Vector Machine Regression (EBK-SVMR) a fost cel mai bun model, cu valoare scăzută RMSE (95.) mg. s și coeficient ridicat de determinare (R2 = 0,637). Ieșirea tehnicii de modelare EBK-SVMR este vizualizată folosind o hartă de auto-organizare. Neuronii grupați în planul modelului hibrid CakMg-EBK-SVMR componentă prezintă modele de culori multiple care prezic concentrațiile de Ni în solurile urbane și periurbane. soluri urbane.
Nichelul (Ni) este considerat un micronutrient pentru plante, deoarece contribuie la fixarea azotului (N) atmosferic și la metabolismul ureei, ambele fiind necesare pentru germinarea semințelor. Pe lângă contribuția sa la germinarea semințelor, Ni poate acționa ca un inhibitor fungic și bacterian și poate promova dezvoltarea plantelor. Lipsa nichelului din sol permite plantei să-l absoarbă, de exemplu, ca urmare a aplicării clorului verde, rezultă în aplicarea clorului verde. îngrășăminte pe bază de el pentru a optimiza fixarea azotului 2. Aplicarea continuă a îngrășămintelor pe bază de nichel pentru a îmbogăți solul și a crește capacitatea leguminoaselor de a fixa azotul în sol crește continuu concentrația de nichel în sol. Deși nichelul este un micronutrient pentru plante, aportul său excesiv în sol poate face mai mult rău decât bine. ca un nutrient esențial pentru creșterea plantelor1. Conform Liu3, Ni s-a dovedit a fi al 17-lea element important necesar pentru dezvoltarea și creșterea plantelor. Pe lângă rolul nichelului în dezvoltarea și creșterea plantelor, oamenii au nevoie de el pentru o varietate de aplicații. Placarea galvanizată, producția de aliaje pe bază de nichel și fabricarea de dispozitive de aprindere și bujii necesită toate în sectorul industrial al aliajelor de nichel. și articolele galvanizate au fost utilizate pe scară largă în ustensile de bucătărie, accesorii pentru sala de bal, consumabile pentru industria alimentară, electricitate, sârmă și cablu, turbine cu reacție, implanturi chirurgicale, textile și construcții navale. vegetație, incendii forestiere și procese geologice;totuși, sursele antropogenice includ bateriile cu nichel/cadmiu din industria siderurgică, galvanizarea, sudarea cu arc, motorină și păcură și emisiile atmosferice de la arderea cărbunelui și incinerarea deșeurilor și a nămolului Acumularea de nichel7,8.Conform lui Freedman și Hutchinson9 și Manyiwa și colab.10, principalele surse de poluare a solului din mediul imediat și adiacent sunt în principal topitorii și minele pe bază de nichel-cupru. Solul superior din jurul rafinăriei de nichel-cupru Sudbury din Canada a avut cel mai mare nivel de contaminare cu nichel, de 26.000 mg/kg11. ms şi colab.12, cantitatea de nichel extractabil cu HNO3 în terenul arabil de top din regiune (producția de nichel în Rusia) a variat între 6,25 și 136,88 mg/kg, corespunzând unei medii de 30,43 mg/kg și unei concentrații de bază de 25 mg/kg. Conform Kabata 11, aplicarea de succes a îngrășămintelor fosforice urbane în timpul sezonului urban sau a îngrășămintelor agricole. Pot infuza sau contamina solul. Efectele potențiale ale nichelului la oameni pot duce la cancer prin mutageneză, leziuni cromozomiale, generarea Z-ADN, repararea blocată a exciziei ADN sau procese epigenetice13. În experimentele pe animale, s-a descoperit că nichelul are potențialul de a provoca o varietate de tumori, iar tumorile cancerigene pot exacerbate astfel de complexe de nichel.
Evaluările de contaminare a solului au înflorit în ultima vreme din cauza unei game largi de probleme legate de sănătate care decurg din relațiile sol-plantă, relațiile sol și biologice ale solului, degradarea ecologică și evaluarea impactului asupra mediului. Până în prezent, predicția spațială a elementelor potențial toxice (PTE) precum Ni din sol a fost laborioasă și consumatoare de timp, folosind metodele tradiționale de cartografiere, astfel încât apariția lor (DSM) s-a îmbunătățit în mod semnificativ. tive soil mapping (PSM). În conformitate cu Minasny și McBratney16, predictive soil mapping (DSM) s-a dovedit a fi o subdisciplină proeminentă a științei solului. Lagacherie și McBratney, 2006 definesc DSM ca „crearea și completarea sistemelor de informații spațiale ale solului prin utilizarea in situ și a sistemelor de observație in situ și de laborator și a metodelor de observație și non-inferență spațială.17 subliniază că DSM sau PSM contemporan este cea mai eficientă tehnică pentru prezicerea sau maparea distribuției spațiale a PTE-urilor, a tipurilor de sol și a proprietăților solului. Geostatistica și algoritmii de învățare automată (MLA) sunt tehnici de modelare DSM care creează hărți digitalizate cu ajutorul computerelor folosind date semnificative și minime.
Deutsch18 și Olea19 definesc geostatistica ca „colecția de tehnici numerice care se ocupă cu reprezentarea atributelor spațiale, utilizând în principal modele stocastice, cum ar fi modul în care analiza serii de timp caracterizează datele temporale”.În primul rând, geostatistica implică evaluarea variogramelor, care permit cuantificarea și definirea dependențelor valorilor spațiale din fiecare set de date20.Gumiaux et al.20 ilustrează în continuare că evaluarea variogramelor în geostatistică se bazează pe trei principii, inclusiv (a) calcularea scalei corelației datelor, (b) identificarea și calculul anizotropiei în disparitatea setului de date și (c) în plus față de luarea în considerare a erorii inerentă a datelor de măsurare separate de efectele locale, efectele zonei sunt, de asemenea, utilizate în conceptele generale de kriging, de interpolare. co-kriging, kriging obișnuit, kriging Bayesian empiric, metoda kriging simplă și alte tehnici de interpolare bine-cunoscute pentru cartografierea sau prezicerea PTE, caracteristicile solului și tipurile de sol.
Algoritmii de învățare automată (MLA) sunt o tehnică relativ nouă care utilizează clase de date neliniare mai mari, alimentate de algoritmi utilizați în principal pentru extragerea datelor, identificarea tiparelor în date și aplicate în mod repetat pentru clasificarea în domenii științifice precum știința solului și sarcinile de returnare. Numeroase lucrări de cercetare se bazează pe modele MLA pentru a prezice, cum ar fi PTE și altele.22 (păduri aleatorii pentru estimarea metalelor grele în solurile agricole), Sakizadeh et al.23 (modelare folosind mașini vector suport și rețele neuronale artificiale) poluarea solului). În plus, Vega și colab.24 (CART pentru modelarea retenției și adsorbției metalelor grele în sol) Sun și colab.25 (aplicarea cubistului este distribuția Cd-ului în sol) și alți algoritmi, cum ar fi k-cel mai apropiat vecin, regresia generalizată amplificată și regresia stimulată. Arborii au aplicat, de asemenea, MLA pentru a prezice PTE în sol.
Aplicarea algoritmilor DSM în predicție sau cartografiere se confruntă cu mai multe provocări. Mulți autori consideră că MLA este superior geostatisticii și invers. Deși unul este mai bun decât celălalt, combinația celor două îmbunătățește nivelul de acuratețe al cartografierii sau al predicției în DSM15.Woodcock și Gopal26 Finke27;Pontius și Cheuk28 și Grunwald29 comentează deficiențele și unele erori în cartografierea solului prezisă. Oamenii de știință ai solului au încercat o varietate de tehnici pentru a optimiza eficacitatea, acuratețea și predictibilitatea cartografierii și prognozei DSM. Combinația dintre incertitudine și verificare este unul dintre multele aspecte diferite integrate în DSM și reduce, totodată, eficiența și optimizarea defectelor.15 subliniază că comportamentul de validare și incertitudinea introduse de crearea și predicția hărții ar trebui validate independent pentru a îmbunătăți calitatea hărții. Limitările DSM se datorează calității solului dispersat geografic, care implică o componentă de incertitudine;cu toate acestea, lipsa de certitudine în DSM poate apărea din surse multiple de eroare, și anume eroarea covariabilă, eroarea modelului, eroarea de locație și eroarea analitică 31. Inexactitățile de modelare induse în procesele MLA și geostatistice sunt asociate cu o lipsă de înțelegere, ceea ce duce în cele din urmă la simplificarea excesivă a procesului real32. interpolare33. Recent, a apărut o nouă tendință DSM care promovează integrarea geostatisticii și MLA în cartografiere și prognoză. Mai mulți oameni de știință ai solului și autori, cum ar fi Sergeev și colab.34;Subbotina și colab.35;Tarasov et al.36 și Tarasov și colab.37 au exploatat calitatea precisă a geostatisticii și a învățării automate pentru a genera modele hibride care îmbunătățesc eficiența prognozării și a cartografierii.Unele dintre aceste modele de algoritm hibrid sau combinat sunt Criging Neural Network Artificial (ANN-RK), Multilayer Perceptron Residual Kriging (MLP-RK), Regression Generalized Neural Network Residual Kriging (GR-NNRK)36, Artificial Neural Network Kriging-Multilayer Perceptron (ANN-K-MLP)37 și procesare Gaussian și regresie.
Potrivit lui Sergeev et al., combinarea diferitelor tehnici de modelare are potențialul de a elimina defectele și de a crește eficiența modelului hibrid rezultat, mai degrabă decât de a dezvolta modelul său unic. În acest context, această nouă lucrare susține că este necesar să se aplice un algoritm combinat de geostatistică și MLA pentru a crea modele hibride optime pentru a prezice îmbogățirea Ni în zonele urbane și periurbane. Modele de mașină (SVM) și regresie liniară multiplă (MLR). Hibridizarea EBK cu orice MLA nu este cunoscută. Modelele mixte multiple văzute sunt combinații de kriging obișnuit, rezidual, de regresie și MLA.EBK este o metodă de interpolare geostatistică care utilizează un proces spațial stocastic care este localizat ca un câmp nestaționar, cu parametrii spațiali care permit localizarea ne-staționară. .EBK a fost utilizat într-o varietate de studii, inclusiv analiza distribuției carbonului organic în solurile fermelor40, evaluarea poluării solului41 și cartografierea proprietăților solului42.
Pe de altă parte, Self-Organizing Graph (SeOM) este un algoritm de învățare care a fost aplicat în diverse articole, cum ar fi Li et al.43, Wang şi colab.44, Hossain Bhuiyan et al.45 și Kebonye și colab.46 Determinați atributele spațiale și gruparea elementelor.Wang și colab.44 subliniază că SeOM este o tehnică puternică de învățare cunoscută pentru capacitatea sa de a grupa și imagina probleme neliniare. Spre deosebire de alte tehnici de recunoaștere a modelelor, cum ar fi analiza componentelor principale, clusteringul fuzzy, clusteringul ierarhic și luarea deciziilor cu mai multe criterii, SeOM este mai bun la organizarea și identificarea tiparelor PTE. Potrivit lui Wang et al.44, SeOM poate grupa spațial distribuția neuronilor înrudiți și oferă vizualizare a datelor de înaltă rezoluție. SeOM va vizualiza datele de predicție Ni pentru a obține cel mai bun model pentru a caracteriza rezultatele pentru interpretare directă.
Această lucrare își propune să genereze un model de cartografiere robust cu acuratețe optimă pentru prezicerea conținutului de nichel în solurile urbane și periurbane. Emitem ipoteza că fiabilitatea modelului mixt depinde în principal de influența altor modele atașate modelului de bază. Recunoaștem provocările cu care se confruntă DSM și, în timp ce aceste provocări sunt abordate pe mai multe fronturi, combinațiile de statistici și progrese MLA apar în modelele geostatistice incrementale;prin urmare, vom încerca să răspundem la întrebările de cercetare care ar putea genera modele mixte. Cu toate acestea, cât de precis este modelul la prezicerea elementului țintă? De asemenea, care este nivelul de evaluare a eficienței bazat pe validare și evaluarea acurateței? Prin urmare, obiectivele specifice ale acestui studiu au fost de a (a) crearea unui model de amestec combinat pentru SVMR sau MLR, folosind modelul EBK (Nic) de concentrare pentru a compara modelul de bază pentru predicția rezultatului, (b) Nic. în soluri urbane sau periurbane și (d) aplicarea SeOM pentru a crea o hartă de înaltă rezoluție a variației spațiale de nichel.
Studiul se desfășoară în Republica Cehă, în special în districtul Frydek Mistek din regiunea Moravia-Silezia (vezi Figura 1). Geografia zonei de studiu este foarte accidentată și face în mare parte parte din regiunea Moravia-Silezia Beskidy, care face parte din marginea exterioară a Munților Carpați. 25 și 327 m;cu toate acestea, sistemul de clasificare Koppen pentru starea climatică a regiunii este evaluat ca Cfb = climat oceanic temperat, Există multe precipitații chiar și în lunile secetoase. Temperaturile variază ușor pe parcursul anului între -5 °C și 24 °C, rareori coborând sub -14 °C sau peste 30 °C, în timp ce media anuală a precipitațiilor este estimată între 28 mm și 77 mm. 1.208 kilometri pătrați, cu 39,38% din terenul cultivat și 49,36% din acoperirea pădurii. Pe de altă parte, suprafața utilizată în acest studiu este de aproximativ 889,8 kilometri pătrați. În Ostrava și în împrejurimi, industria siderurgică și metalurgia sunt foarte active. Morii metalurgice, industria siderurgică în care se folosește oțelul inoxidabil la coroziune (ex. rezistența la coroziune a oțelului aliat) rezistența aliajului, menținând în același timp o bună ductilitate și duritate), precum și agricultura intensivă, cum ar fi aplicarea de îngrășăminte fosfatice și producția de animale, sunt surse potențiale de cercetare de nichel în regiune (de exemplu, adăugarea de nichel la miei pentru a crește ratele de creștere la miei și la bovine cu hrănire scăzută). culoarea solului, structura și conținutul de carbonați. Textura solului este medie spre fină, derivată din materialul de bază. Sunt de natură coluvială, aluvială sau eoliană. Unele zone de sol apar pete pe suprafață și subsol, adesea cu beton și albire. cambisolurile domină Cehia49.
Harta zonei de studiu [Harta zonei de studiu a fost creată folosind ArcGIS Desktop (ESRI, Inc, versiunea 10.7, URL: https://desktop.arcgis.com).]
Un total de 115 probe de sol vegetal au fost obținute din soluri urbane și periurbane din districtul Frydek Mistek. Modelul de eșantion utilizat a fost o grilă obișnuită cu probe de sol distanțate la 2 × 2 km, iar solul vegetal a fost măsurat la o adâncime de 0 până la 20 cm folosind un dispozitiv GPS de mână (Leica Zeno 5 GPS). probele au fost uscate cu aer pentru a produce probe pulverizate, pulverizate printr-un sistem mecanic (moara cu discuri Fritsch) și cernute (dimensiunea sitei 2 mm). Puneți 1 gram de mostre de sol uscate, omogenizate și cernute în sticle de teflon clar etichetate. În fiecare vas de teflon, distribuiți 7 ml de HCl 35% și un dozator automat de 35% H36 fiecare acid), se acoperă ușor și se lasă probele să stea peste noapte pentru reacție (program aqua regia). Se așează supernatantul pe o placă metalică fierbinte (temperatura: 100 W și 160 °C) timp de 2 ore pentru a facilita procesul de digestie a probelor, apoi se răcește. Se transferă supernatantul într-un balon cotat de 50 ml, cu diluantul de 50 ml. într-un tub PVC de 50 ml cu apă deionizată. În plus, 1 ml de soluție de diluție a fost diluat cu 9 ml de apă deionizată și filtrat într-un tub de 12 ml pregătit pentru pseudo-concentrarea PTE. Concentrațiile de PTE (As, Cd, Cr, Cu, Mn, Ni, Pb, Zn, Ca, KP-O) au fost determinate de emisie optimă prin inducție ECP-O. Spectroscopie) (Thermo Fisher Scientific, SUA) conform metodelor standard și acordului. Asigurarea procedurilor de asigurare și control al calității (QA/QC) (SRM NIST 2711a Montana II Soil). PTE-urile cu limite de detecție mai mici de jumătate au fost excluse din acest studiu. Limita de detecție a PTE utilizată în acest studiu a fost de 0,00004. Pentru a se asigura că erorile au fost minimizate, a fost efectuată o dublă analiză.
Kriging Bayesian Empiric (EBK) este una dintre multele tehnici de interpolare geostatistică utilizate în modelare în diverse domenii, cum ar fi știința solului. Spre deosebire de alte tehnici de interpolare kriging, EBK diferă de metodele tradiționale de kriging prin luarea în considerare a erorii estimate de modelul semivariogramă. această reprezentare grafică a semivariogramei care constituie o parte extrem de complexă a unei metode de kriging suficient. Procesul de interpolare a EBK urmează cele trei criterii propuse de Krivoruchko50, (a) modelul estimează semivariograma din setul de date de intrare (b) noua valoare prezisă pentru fiecare locație a setului de date de intrare pe baza semivariogramei generate și (c) datele finale ale modelului simulat sunt simulate după cum este modelul posterior.
Unde \(Prob\left(A\right)\) reprezintă prioritatea, \(Prob\left(B\right)\) probabilitatea marginală este ignorată în majoritatea cazurilor, \(Prob (B,A)\ ). este cât de probabil este să se creeze un set de date de observații din semivariogramă.
O mașină de vector de suport este un algoritm de învățare automată care generează un hiperplan de separare optim pentru a distinge clase identice, dar nu liniar independente. analiză.Cherkassky și ​​Mulier53 au fost pionierul SVMR ca regresie bazată pe nucleu, al cărei calcul a fost efectuat folosind un model de regresie liniară cu funcții spațiale în mai multe țări.55, epsilon (ε)-SVMR folosește setul de date antrenat pentru a obține un model de reprezentare ca o funcție insensibilă la epsilon, care este aplicată pentru a mapa datele în mod independent cu cea mai bună părtinire epsilon din antrenamentul pe date corelate. Eroarea de distanță prestabilită este ignorată din valoarea reală, iar dacă eroarea este mai mare decât ε(ε), proprietățile solului o compensează, de asemenea, complexitatea modelului de antrenament al subsetului de suport al solului. cotația propusă de Vapnik51 este prezentată mai jos.
unde b reprezintă pragul scalar, \(K\left({x}_{,}{ x}_{k}\right)\) reprezintă funcția de nucleu, \(\alpha\) reprezintă multiplicatorul Lagrange, N reprezintă un set de date numerice, \({x}_{k}\) reprezintă intrarea datelor și \(y\) este operația de ieșire a datelor care este radiantul radiant SV, a cărui ieșire este utilizată. funcția de bază (RBF). Nucleul RBF este aplicat pentru a determina modelul SVMR optim, care este critic pentru a obține cel mai subtil factor de penalizare C și parametrul nucleului gamma (γ) pentru datele de antrenament PTE. În primul rând, am evaluat setul de antrenament și apoi am testat performanța modelului pe setul de validare. Parametrul de direcție utilizat este sigma și valoarea metodei este svmRadials.
Un model de regresie liniară multiplă (MLR) este un model de regresie care reprezintă relația dintre variabila răspuns și un număr de variabile predictoare prin utilizarea parametrilor liniari cumulați calculați folosind metoda celor mai mici pătrate. În MLR, un model cu cele mai mici pătrate este o funcție predictivă a proprietăților solului după selectarea variabilelor explicative. Este necesar să se utilizeze răspunsul pentru a stabili o relație liniară cu variabila explicativă a răspunsului folosind variabila explicativă a relației M cu răspunsul explicativ. Ecuația LR este
unde y este variabila răspuns, \(a\) este interceptul, n este numărul de predictori, \({b}_{1}\) este regresia parțială a coeficienților, \({x}_{ i}\) reprezintă un predictor sau o variabilă explicativă și \({\varepsilon }_{i}\) reprezintă eroarea în model, cunoscută și ca rezidual.
Modelele mixte au fost obținute prin sandwiching EBK cu SVMR și MLR. Acest lucru se face prin extragerea valorilor prezise din interpolarea EBK. Valorile prezise obținute din Ca, K și Mg interpolați sunt obținute printr-un proces combinatoriu pentru a obține noi variabile, cum ar fi CaK, CaMg și KMg. Elementele Ca, K și Mg sunt obținute, apoi, variabilele Ca, K și Mg sunt a patra combinate la variabila Ca Mg, iar apoi se obțin variabilele a patra. , K, Mg, CaK, CaMg, KMg și CaKMg. Aceste variabile au devenit predictorii noștri, ajutând la prezicerea concentrațiilor de nichel în solurile urbane și periurbane. Algoritmul SVMR a fost efectuat pe predictori pentru a obține un model mixt Empirical Bayesian Kriging-Support Vector Machine (EBK_SVM). ian Kriging-Regresie liniară multiplă (EBK_MLR). De obicei, variabilele Ca, K, Mg, CaK, CaMg, KMg și CaKMg sunt utilizate ca covariabile ca predictori ai conținutului de Ni în solurile urbane și periurbane. Cel mai acceptabil model obținut (EBK_SVM sau EBK_MLR) va fi apoi prezentat într-un studiu de auto-organizare a fluxului.
Utilizarea SeOM a devenit un instrument popular pentru organizarea, evaluarea și prognoza datelor în sectorul financiar, sănătate, industrie, statistică, știința solului și altele. variabile43,56.Melssen et al.57 descriu conectarea unui vector de intrare într-o rețea neuronală printr-un singur strat de intrare la un vector de ieșire cu un singur vector de greutate. Ieșirea generată de SeOM este o hartă bidimensională constând din diferiți neuroni sau noduri țesute în hărți topologice hexagonale, circulare sau pătrate, în funcție de proximitatea lor. Compararea dimensiunilor hărții bazate pe metric, eroarea de cuantizare (QE) și eroarea modelului tepografic (TE), 4090, respectiv . ly, este selectată, care este o unitate de 55 de hărți (5 × 11). Structura neuronului este determinată în funcție de numărul de noduri din ecuația empirică
Numărul de date utilizate în acest studiu este de 115 eșantioane. O abordare aleatorie a fost utilizată pentru a împărți datele în date de testare (25% pentru validare) și seturi de date de antrenament (75% pentru calibrare). proces de validare, repetat de cinci ori. Variabilele produse de interpolarea EBK sunt folosite ca predictori sau variabile explicative pentru a prezice variabila țintă (PTE). Modelarea este gestionată în RStudio folosind biblioteca de pachete (Kohonen), bibliotecă (caret), bibliotecă (modelr), bibliotecă ("e1071″), bibliotecă ("plyr"), biblioteci ("plyr") și biblioteci prospective ("plyr"), biblioteci („plyr”) și biblioteci prospective. .
Au fost utilizați diferiți parametri de validare pentru a determina cel mai bun model potrivit pentru prezicerea concentrațiilor de nichel în sol și pentru a evalua acuratețea modelului și validarea acestuia. Modelele de hibridizare au fost evaluate folosind eroarea medie absolută (MAE), eroarea pătratică medie (RMSE) și determinarea R-pătrat sau coeficient (R2). puterea predictivă a modelului, în timp ce MAE determină valoarea cantitativă reală. Valoarea R2 trebuie să fie mare pentru a evalua cel mai bun model de amestec folosind parametrii de validare, cu cât valoarea este mai apropiată de 1, cu atât este mai mare acuratețea. Potrivit lui Li et al.59, o valoare a criteriului R2 de 0,75 sau mai mare este considerată un bun predictor;de la 0,5 la 0,75 este performanța acceptabilă a modelului, iar sub 0,5 este performanța inacceptabilă a modelului. La selectarea unui model folosind metodele de evaluare a criteriilor de validare RMSE și MAE, valorile mai mici obținute au fost suficiente și au fost considerate cea mai bună alegere. Ecuația următoare descrie metoda de verificare.
unde n reprezintă mărimea valorii observate\({Y}_{i}\) reprezintă răspunsul măsurat, iar \({\widehat{Y}}_{i}\) reprezintă, de asemenea, valoarea răspunsului prezis, prin urmare, pentru primele i observații.
Descrierile statistice ale variabilelor predictoare și de răspuns sunt prezentate în Tabelul 1, arătând media, abaterea standard (SD), coeficientul de variație (CV), minim, maxim, curtoză și asimetrie. Valorile minime și maxime ale elementelor sunt în ordinea descrescătoare a Mg < Ca < K < Ni și Ca < Mg < K < Ni, respectiv. 39 mg/kg. Comparația Ni cu media mondială (29 mg/kg) și media europeană (37 mg/kg) a arătat că media geometrică globală calculată pentru zona de studiu a fost în intervalul tolerabil. Cu toate acestea, așa cum arată Kabata-Pendias11, o comparație a concentrației medii de nichel (Ni) din studiul actual cu concentrația medie de nichel agricolă în solurile actuale arată că concentrația medie de nichel este mai mare în solurile S-Liweden. dek Mistek în solurile urbane și periurbane în studiul curent (Ni 16,15 mg/kg) a fost mai mare decât limita admisibilă de 60 (10,2 mg/kg) pentru Ni în solurile urbane poloneze raportate de Różański și colab. În plus, Bretzel și Calderisi61 au înregistrat concentrații medii foarte scăzute de Ni (1,72 mg/kg) în studiul urban, de asemenea, în comparație cu 1,72 mg/kg în studiul actual, în comparație cu cele urbane. concentrația de nichel (12,34 mg/kg) în solurile urbane din Hong Kong, care este mai mică decât concentrația actuală de nichel din acest studiu. zonele suburbane ale zonei de studiu pot fi atribuite în principal industriei siderurgice și industriei metalelor. Acest lucru este în concordanță cu studiul lui Khodadoust și colab.64 că industria siderurgică și prelucrarea metalelor sunt principalele surse de contaminare a solurilor cu nichel. Cu toate acestea, predictorii au variat, de asemenea, de la 538,70 mg/kg la 69.161,80 mg/kg pentru Ca, 497,51 mg/kg până la 3535,68 mg/kg pentru K și 685,685,685 mg/kg pentru K și 685,685 mg/kg și 685,05 mg/kg/kg .65 au investigat conținutul total de Mg și K al solurilor din centrul Serbiei. Ei au constatat că concentrațiile totale (410 mg/kg și, respectiv, 400 mg/kg) au fost mai mici decât concentrațiile de Mg și K din studiul curent. Indistinguibil, în estul Poloniei, Orzechowski și Smolczynski66 au evaluat conținutul total de Mg/kg și Ca și concentrația medie de Mg/kg (1,0, Mg) 590 mg/kg) și K (810 mg/kg) Conținutul din sol este mai mic decât elementul unic din acest studiu. Un studiu recent al lui Pongrac și colab.67 a arătat că conținutul total de Ca analizat în 3 soluri diferite din Scoția, Marea Britanie (sol Mylnefield, sol Balruddery și sol Hartwood) a indicat un conținut mai mare de Ca în acest studiu.
Datorită concentrațiilor diferite măsurate ale elementelor eșantionate, distribuțiile setului de date ale elementelor prezintă asimetrie diferită. Asimul și curtoza elementelor au variat de la 1,53 la 7,24 și, respectiv, de la 2,49 la 54,16. Toate elementele calculate au niveluri de asimetrie și kurtoză de deasupra +1, indicând astfel că distribuția peak și skew sunt estimate în direcția corectă și neregulată a datelor estimate. elementele arată, de asemenea, că K, Mg și Ni prezintă o variabilitate moderată, în timp ce Ca are o variabilitate extrem de mare. CV-urile K, Ni și Mg explică distribuția lor uniformă. În plus, distribuția Ca este neuniformă și sursele externe pot afecta nivelul de îmbogățire.
Corelația variabilelor predictoare cu elementele de răspuns a indicat o corelație satisfăcătoare între elemente (vezi Figura 3). Corelația a indicat că CaK a prezentat o corelație moderată cu valoarea r = 0,53, la fel ca CaNi. Deși Ca și K prezintă asocieri modeste între ele, cercetători precum Kingston și colab.68 și Santo69 sugerează că nivelurile lor în sol sunt invers proporționale. Cu toate acestea, Ca și Mg sunt antagoniste cu K, dar CaK se corelează bine. Acest lucru se poate datora aplicării de îngrășăminte precum carbonatul de potasiu, care este cu 56% mai mare în potasiu. Potasiul a fost moderat corelat cu magneziul (KM 63). sulfatul de um, azotat de potasiu, magneziu și potasiu sunt aplicate pe sol pentru a crește nivelul de deficiență al acestora. Nichelul este moderat corelat cu Ca, K și Mg cu valori r = 0,52, 0,63 și, respectiv, 0,55. Relațiile care implică calciu, magneziu și PTE-uri, cum ar fi nichel, magneziu și efectul de reducere a calciului, fără nichel sau absența calciului sunt complexe, dar fără absență. excesul de magneziu, iar atât magneziul, cât și calciul reduc efectele toxice ale nichelului în sol.
Matrice de corelație pentru elemente care arată relația dintre predictori și răspunsuri (Notă: această figură include un grafic de dispersie între elemente, nivelurile de semnificație se bazează pe p < 0,001).
Figura 4 ilustrează distribuția spațială a elementelor. Conform Burgos și colab.70, aplicarea distribuției spațiale este o tehnică utilizată pentru cuantificarea și evidențierea punctelor fierbinți din zonele poluate. Nivelurile de îmbogățire ale Ca din Fig. 4 pot fi observate în partea de nord-vest a hărții de distribuție spațială. oxid) pentru a reduce aciditatea solului și utilizarea acestuia în fabricile de oțel ca oxigen alcalin în procesul de fabricare a oțelului. Pe de altă parte, alți fermieri preferă să folosească hidroxid de calciu în soluri acide pentru a neutraliza pH-ul, ceea ce crește și conținutul de calciu al solului71. Potasiul prezintă, de asemenea, puncte fierbinți în nord-vest și estul hărții. Aplicații NPK și potasiu. Acest lucru este în concordanță cu alte studii, cum ar fi Madaras și Lipavský72, Madaras și colab.73, Pulkrabová și colab.74, Asare și colab.75, care au observat că stabilizarea solului și tratarea cu KCl și NPK au dus la un conținut ridicat de K în sol.Îmbogățirea spațială cu potasiu în nord-vestul hărții de distribuție se poate datora utilizării îngrășămintelor pe bază de potasiu, cum ar fi clorură de potasiu, sulfat de potasiu, azotat de potasiu, potasiu și potasiu pentru a crește conținutul de potasiu al solurilor sărace.Zádorová et al.76 și Tlustoš și colab.77 au subliniat că aplicarea îngrășămintelor pe bază de K a crescut conținutul de K în sol și ar crește semnificativ conținutul de nutrienți din sol pe termen lung, în special K și Mg arătând un punct fierbinte în sol. Puncte fierbinți relativ moderate în nord-vestul hărții și sud-estul hărții. cloroza.Îngrășămintele pe bază de magneziu, cum ar fi sulfatul de magneziu de potasiu, sulfatul de magneziu și Kieseritul, tratează deficiențele (plantele apar violet, roșu sau maro, indicând deficiența de magneziu) în solurile cu un interval normal de pH6. Acumularea de nichel pe suprafețele solului urban și periurban se poate datora unor activități precum producția de oțel inoxidabil în agricultură și nichel inoxidabil87.
Distribuția spațială a elementelor [harta de distribuție spațială a fost creată folosind ArcGIS Desktop (ESRI, Inc, Versiunea 10.7, URL: https://desktop.arcgis.com).]
Rezultatele indicelui de performanță al modelului pentru elementele utilizate în acest studiu sunt prezentate în Tabelul 2. Pe de altă parte, RMSE și MAE ale Ni sunt ambele aproape de zero (0,86 RMSE, -0,08 MAE). Pe de altă parte, ambele valori RMSE și MAE ale K sunt acceptabile. Rezultatele RMSE și MAE au fost mai mari pentru calciu și magneziu. Acest studiu care folosește EBK pentru a prezice Ni s-a dovedit a fi mai bun decât rezultatele lui John și colab.54 folosind kriging sinergic pentru a prezice concentrațiile de S în sol folosind aceleași date colectate. Rezultatele EBK pe care le-am studiat se corelează cu cele ale lui Fabijaczyk și colab.41, Yan şi colab.79, Beguin şi colab.80, Adhikary şi colab.81 şi John şi colab.82, în special K și Ni.
Performanța metodelor individuale de predicție a conținutului de nichel în solurile urbane și periurbane a fost evaluată folosind performanța modelelor (Tabelul 3). Validarea modelului și evaluarea acurateței au confirmat că predictorul Ca_Mg_K combinat cu modelul EBK SVMR a dat cea mai bună performanță. 7 (R2), 95,479 mg/kg (RMSE) și 77,368 mg/kg (MAE) Ca_Mg_K-SVMR a fost de 0,663 (R2), 235,974 mg/kg (RMSE) și 166,946 mg/kg (MAE). _Mg-EBK_SVMR (0,643 = R2);rezultatele lor RMSE și MAE au fost mai mari decât cele pentru Ca_Mg_K-EBK_SVMR (R2 0,637) (a se vedea tabelul 3). În plus, RMSE și MAE ale modelului Ca_Mg-EBK_SVMR (RMSE = 1664,64 și MAE = 1031,49) sunt 17,4 din Ca_Mg și, respectiv, mai mari decât cele 17,4-EBK_M K_SVMR. De asemenea, RMSE și MAE ale modelului Ca_Mg-K SVMR (RMSE = 235,974 și MAE = 166,946) sunt cu 2,5 și 2,2 mai mari decât cele ale Ca_Mg_K-EBK_SVMR RMSE și, respectiv, MAE. au fost observate.Potrivit Kebonye et al.46 și john și colab.54, cu cât RMSE și MAE sunt mai aproape de zero, cu atât rezultatele sunt mai bune. . Aceasta înseamnă că, cu cât setul de date este mai eterogen, cu atât valorile MAE și RMSE sunt mai mari. Precizia evaluării prin validare încrucișată a modelului mixt Ca_Mg_K-EBK_SVMR pentru predicția conținutului de Ni în solurile urbane și suburbane a fost de 63,70%. Conform lui Li et al.59, acest nivel de acuratețe este o rată acceptabilă de performanță a modelului. Rezultatele prezente sunt comparate cu un studiu anterior al lui Tarasov și colab.36 al cărui model hibrid a creat MLPRK (Multilayer Perceptron Residual Kriging), legat de indicele de evaluare a acurateței EBK_SVMR raportat în studiul curent, RMSE (210) și The MAE (167,5) au fost mai mari decât rezultatele noastre din studiul actual (RMSE 95,479, MAE 77,36,36,36,36,36,77,36,36,36,363). Tarasov et al.36 (0.544), este clar că coeficientul de determinare (R2) este mai mare în acest model mixt. Marja de eroare (RMSE și MAE) (EBK SVMR) pentru modelul mixt este de două ori mai mică. ).Nivelul de precizie al predicției acestui model (EBK SVMR) este de 63,7%, în timp ce acuratețea predicției obținută de Sergeev și colab.34 este 28%. Harta finală (Fig. 5) creată folosind modelul EBK_SVMR și Ca_Mg_K ca predictor arată predicții de puncte fierbinți și moderate până la nichel pe întreaga zonă de studiu. Aceasta înseamnă că concentrația de nichel în zona de studiu este în principal moderată, cu concentrații mai mari în anumite zone specifice.
Harta de predicție finală este reprezentată folosind modelul hibrid EBK_SVMR și folosind Ca_Mg_K ca predictor. [Harta de distribuție spațială a fost creată folosind RStudio (versiunea 1.4.1717: https://www.rstudio.com/).]
În Figura 6 sunt prezentate concentrațiile de PTE ca un plan de compoziție format din neuroni individuali. Niciunul dintre planurile componente nu a prezentat același model de culoare ca cel prezentat. Cu toate acestea, numărul adecvat de neuroni pe hartă desenată este de 55. SeOM este produs folosind o varietate de culori și cu cât modelele de culoare sunt mai asemănătoare, cu atât proprietățile probelor sunt mai comparabile. Astfel, CaK și CaMg au unele asemănări cu neuronii de ordin foarte înalt și modelele de culoare scăzute spre moderate. Ambele modele prezic concentrația de Ni în sol afișând nuanțe medii spre mari de culori, cum ar fi roșu, portocaliu și galben. modelul a arătat un model de culoare ridicat care indică concentrația potențială de nichel în sol (vezi Figura 4). Planul componentei modelului CakMg arată un model de culoare divers, de la scăzut la mare, conform unei scale de culoare precise. ils.Figura 7 prezintă metoda conturului în gruparea k-medii de pe hartă, împărțită în trei clustere în funcție de valoarea prezisă în fiecare model. Metoda conturului reprezintă numărul optim de clustere.Din cele 115 probe de sol colectate, categoria 1 a obținut cele mai multe probe de sol, 74.Clusterul 2 a primit 33 de probe simplificate, în timp ce clusterele au primit 33 de eșantioane simplificate, în timp ce s-au primit 33 de eșantioane corecte. interpretarea clusterelor. Din cauza numeroaselor procese antropice și naturale care afectează formarea solului, este dificil să existe modele de cluster diferențiate corespunzător într-o hartă SeOM distribuită78.
Ieșirea planului componentelor de către fiecare variabilă EBK_SVM_SeOM (Empiric Bayesian Kriging Support Vector Machine). [Hărțile SeOM au fost create folosind RStudio (versiunea 1.4.1717: https://www.rstudio.com/).]
Componente diferite de clasificare a clusterelor [Hărțile SeOM au fost create folosind RStudio (versiunea 1.4.1717: https://www.rstudio.com/).]
The current study clearly illustrates modeling techniques for nickel concentrations in urban and peri-urban soils.The study tested different modeling techniques, combining elements with modeling techniques, to obtain the best way to predict nickel concentrations in soil.The SeOM compositional planar spatial features of the modeling technique exhibited a high color pattern from low to high on an accurate color scale, indicating Ni concentrations in the soil.However, the spatial distribution map confirms the planar spatial distribution of components exhibited by EBK_SVMR (see Figure 5).The results show that the support vector machine regression model (Ca Mg K-SVMR) predicts the concentration of Ni in soil as a single model, but the validation and accuracy evaluation parameters show very high errors in terms of RMSE and MAE.On the other hand, the modeling technique employed with the EBK_MLR model is also flawed due to the low value of the coefficient of determination (R2).Good results were obtained using EBK SVMR and combined elements (CaKMg) with low RMSE and MAE errors with an accuracy of 63.7%.It turns out that combining the EBK algorithm with a machine learning algorithm can generate a hybrid algorithm that can predict the concentration of PTEs in soil.The results show that using Ca Mg K as predictors to predict Ni concentrations in the study area can improve the prediction of Ni in soils.This means that the continuous application of nickel-based fertilizers and industrial pollution of the soil by the steel industry has a tendency to increase the concentration of nickel in the soil.This study revealed that the EBK model can reduce the level of error and improve the accuracy of the model of soil spatial distribution in urban or peri-urban soils.In general, we propose to apply the EBK-SVMR model to assess and predict PTE in soil;în plus, propunem să folosim EBK pentru a hibridiza cu diverși algoritmi de învățare automată. Concentrațiile de Ni au fost prezise folosind elemente ca covariabile;cu toate acestea, utilizarea mai multor covariate ar îmbunătăți considerabil performanța modelului, ceea ce poate fi considerat o limitare a lucrării curente. O altă limitare a acestui studiu este că numărul de seturi de date este de 115. Prin urmare, dacă sunt furnizate mai multe date, performanța metodei de hibridizare optimizată propusă poate fi îmbunătățită.
PlantProbs.net.Nichel în plante și sol https://plantprobs.net/plant/nutrientImbalances/sodium.html (Accesat 28 aprilie 2021).
Kasprzak, KS Nickel progrese în toxicologia modernă a mediului înconjurător.toxicologie.11, 145–183 (1987).
Cempel, M. & Nikel, G. Nickel: O revizuire a surselor sale și a toxicologiei mediului.Polish J. Environment.Stud.15, 375–382 (2006).
Freedman, B. & Hutchinson, TC Aportul de poluanți din atmosferă și acumularea în sol și vegetație în apropierea unei topitorii de nichel-cupru din Sudbury, Ontario, Canada.can.J.Bot.58(1), 108-132.https://doi.org/10.1139/b80-014 (1980).
Manyiwa, T. et al.Metale grele în sol, plante și riscuri asociate cu pășunatul rumegătoarelor în apropierea minei de cupru-nichel Selebi-Phikwe din Botswana.surroundings.Geochemistry.Health https://doi.org/10.1007/s10653-021-00902-x (029021-).
Cabata-Pendias.Kabata-Pendias A. 2011. Oligoelemente în sol și… – Google Scholar https://scholar.google.com/scholar?hl=en&as_sdt=0%2C5&q=Kabata-Pendias+A.+2011.+Trace+ Elements+in+soils+in+soils+in+soils++4+9+%2+9+%2+NewYor%2%2C5&q=Kabata-Pendias+A.+2011. +CRC+Press&btnG= (Accesat 24 noiembrie 2020).
Almås, A., Singh, B., Agriculture, TS-NJ of & 1995, undefined. Efectele industriei ruse de nichel asupra concentrațiilor de metale grele în solurile agricole și ierburile din Soer-Varanger, Norvegia.agris.fao.org.
Nielsen, GD și colab. Absorbția și reținerea nichelului în apa de băut sunt legate de aportul alimentar și sensibilitatea la nichel.toxicologie.aplicații.Pharmacodinamica.154, 67–75 (1999).
Costa, M. & Klein, CB Carcinogeneza, mutația, epigenetica sau selecția nichelului.împrejurări.Health Perspective.107, 2 (1999).
Ajman, PC;Ajado, SK;Borůvka, L.;Bini, JKM;Sarkody, VYO;Cobonye, ​​​​NM;Analiza tendințelor elementelor potențial toxice: o revizuire bibliometrică. Geochimie de mediu și sănătate.Springer Science & Business Media BV 2020.https://doi.org/10.1007/s10653-020-00742-9.
Minasny, B. & McBratney, AB Digital Soil Mapping: A Brief History and Some Lessons.Geoderma 264, 301–311.https://doi.org/10.1016/j.geoderma.2015.07.017 (2016).
McBratney, AB, Mendonça Santos, ML & Minasny, B. On digital soil mapping.Geoderma 117(1-2), 3-52.https://doi.org/10.1016/S0016-7061(03)00223-4 (2003).
Deutsch.CV Geostatistical Reservoir Modeling,… – Google Scholar https://scholar.google.com/scholar?hl=ro&as_sdt=0%2C5&q=CV+Deutsch%2C+2002%2C+Geostatistical+Reservoir+Modeling%2C +Oxford+University++Press2+2GAccess2+3&prs6%2GAccess. 2021).


Ora postării: 22-iul-2022