Predikce koncentrací niklu v předměstských a městských půdách pomocí smíšeného empirického bayesovského krigování a regrese podpůrného vektorového stroje

Děkujeme, že jste navštívili Nature.com. Verze prohlížeče, kterou používáte, má omezenou podporu pro CSS. Abyste dosáhli co nejlepšího zážitku, doporučujeme vám používat aktualizovaný prohlížeč (nebo vypnout režim kompatibility v Internet Exploreru). Abychom zajistili nepřetržitou podporu, budeme web mezitím zobrazovat bez stylů a JavaScriptu.
Znečištění půdy je velký problém způsobený lidskou činností. Prostorová distribuce potenciálně toxických prvků (PTE) se ve většině městských a příměstských oblastí liší. Proto je obtížné prostorově předpovídat obsah PTE v takových půdách. Z Frýdku Místku v ČR bylo získáno celkem 115 vzorků. Vápník (Ca), hořčík (Mg), hořčík (Mg), páry draslíku (K) byly stanoveny spektrální koncentrací emisí v spektrální plazmě a niklovou proměnnou koncentrací je Ni a prediktory jsou Ca, Mg a K. Korelační matice mezi proměnnou odezvy a proměnnou prediktoru ukazuje uspokojivou korelaci mezi prvky. Výsledky predikce ukázaly, že strojová regrese podpůrného vektoru (SVMR) fungovala dobře, ačkoli její odhadovaná střední kvadratická chyba (RMSE) (235,974 mg/kg) a průměrná absolutní chyba (MAE) byly u ostatních použitých metod vyšší než EmpiricalMix.16 Bay. Vícenásobná lineární regrese ian Kriging-Multiple Linear Regression (EBK-MLR) funguje špatně, o čemž svědčí koeficienty determinace menší než 0,1. Empirický model Bayesian Kriging-Support Vector Machine Regression (EBK-SVMR) byl nejlepší model s nízkými hodnotami RMSE (95,479 mg/kg) a MAE (77,368 mg/kg) a vysokým koeficientem MAE (77,368 mg/kg) KEB-SV. Výstup techniky modelování je vizualizován pomocí samoorganizující se mapy. Seskupené neurony v rovině hybridního modelu komponenty CakMg-EBK-SVMR vykazují více barevných vzorů, které předpovídají koncentrace Ni v městských a příměstských půdách. Výsledky ukazují, že kombinace EBK a SVMR je efektivní technikou pro předpovídání koncentrací Ni v městských a příměstských půdách.
Nikl (Ni) je považován za mikroživinu pro rostliny, protože přispívá k fixaci atmosférického dusíku (N) a metabolismu močoviny, které jsou oba potřebné pro klíčení semen. Kromě svého příspěvku ke klíčení semen může Ni působit jako plísňový a bakteriální inhibitor a podporovat vývoj rostlin. Nedostatek niklu v půdě umožňuje rostlině jej absorbovat, což má za následek například aplikaci niklových hnojiv a hnojiv na bázi niklu. fixace dusíku2. Pokračující aplikace hnojiv na bázi niklu k obohacení půdy a zvýšení schopnosti luštěnin vázat dusík v půdě neustále zvyšuje koncentraci niklu v půdě. Přestože je nikl pro rostliny mikroživinou, jeho nadměrný příjem v půdě může způsobit více škody než užitku. Toxicita niklu v půdě minimalizuje pH půdy a brání příjmu železa jako základní živiny potřebné pro růst rostlin, bylo zjištěno, že Ni1 je důležitý prvek pro růst rostlin. pro vývoj a růst rostlin.Kromě role niklu ve vývoji a růstu rostlin jej lidé potřebují pro různé aplikace. Galvanické pokovování, výroba slitin na bázi niklu a výroba zapalovacích zařízení a zapalovacích svíček v automobilovém průmyslu, to vše vyžaduje použití niklu v různých průmyslových odvětvích. Kromě toho se slitiny na bázi niklu a galvanicky pokovené výrobky široce používají v průmyslu elektrické energie, drátěných náčiní, kabelů, kuchyňských potřeb, kabelů, textilních doplňků a stavba lodí5. Hladiny bohaté na nikl v půdách (tj. povrchové půdy) byly připisovány jak antropogenním, tak přírodním zdrojům, ale především je Ni přírodním zdrojem spíše než antropogenní4,6. Přírodní zdroje niklu zahrnují sopečné erupce, vegetaci, lesní požáry a geologické procesy;mezi antropogenní zdroje však patří niklové/kadmiové baterie v ocelářském průmyslu, galvanické pokovování, obloukové svařování, nafta a topné oleje a atmosférické emise ze spalování uhlí a odpadů a spalování kalů Akumulace niklu7,8.Podle Freedmana a Hutchinsona9 a Manyiwa et al.10, hlavními zdroji znečištění ornice v bezprostředním a přilehlém prostředí jsou hlavně tavírny a doly na bázi niklu a mědi. Nejvyšší úroveň kontaminace niklem v Kanadě Sudbury měla 26 000 mg/kg11. Naproti tomu znečištění z výroby niklu v Rusku mělo za následek vyšší koncentrace niklu v norské půdě1.12, množství HNO3-extrahovatelného niklu v nejvyšší orné půdě regionu (produkce niklu v Rusku) se pohybovalo od 6,25 do 136,88 mg/kg, což odpovídá průměru 30,43 mg/kg a základní koncentraci 25 mg/kg.Podle kabaty 11, periferní sezóna plodin, může být zemědělská půda kabata 11 aplikována na městskou nebo fosforovou půdu při úspěchu při úspěšné aplikaci hnojiv splynout nebo kontaminovat půdu. Potenciální účinky niklu u lidí mohou vést k rakovině prostřednictvím mutageneze, poškození chromozomů, generování Z-DNA, blokované opravy excize DNA nebo epigenetických procesů13. Při pokusech na zvířatech bylo zjištěno, že nikl má potenciál způsobit různé nádory a karcinogenní komplexy niklu mohou tyto nádory zhoršit.
Hodnocení kontaminace půdy v poslední době vzkvétalo díky široké škále zdravotních problémů vyplývajících ze vztahů mezi půdou a rostlinou, půdních a půdních biologických vztahů, ekologické degradace a hodnocení dopadů na životní prostředí. Dosud byla prostorová predikce potenciálně toxických prvků (PTE), jako je Ni v půdě, pracná a časově náročná pomocí tradičních metod. Nástup digitálního mapování půdy (DSM) a jeho současná úspěšnost mapování půdy McBcorcping Min15ny se výrazně zlepšily. 6, prediktivní mapování půdy (DSM) se ukázalo jako prominentní podobor pedologie. Lagacherie a McBratney, 2006 definují DSM jako „vytváření a plnění prostorových půdních informačních systémů pomocí in situ a laboratorních pozorovacích metod a prostorových a neprostorových půdních inferenčních systémů“. McBratney et al.17 naznačují, že současný DSM neboli PSM je nejúčinnější technikou pro předpovídání nebo mapování prostorového rozložení PTE, typů půd a půdních vlastností. Geostatistika a algoritmy strojového učení (MLA) jsou techniky modelování DSM, které pomocí počítačů vytvářejí digitalizované mapy s využitím významných a minimálních dat.
Deutsch18 a Olea19 definují geostatistiku jako „sbírku numerických technik, které se zabývají reprezentací prostorových atributů, využívajících především stochastické modely, například jak analýza časových řad charakterizuje časová data“.Primárně geostatistika zahrnuje vyhodnocování variogramů, které umožňují kvantifikovat a definovat závislosti prostorových hodnot z každého souboru dat20.Gumiaux et al.20 dále ilustrují, že vyhodnocování variogramů v geostatistice je založeno na třech principech, včetně (a) výpočtu měřítka korelace dat, (b) identifikace a výpočtu anizotropie v disparitě datové sady a (c) navíc Kromě zohlednění inherentní chyby naměřených dat oddělených od lokálních efektů se v těchto geostatistických technikách odhadují i ​​plošné efekty, včetně obecných konceptů, interpolačních technik. - krigování, obyčejné krigování, empirické bayesovské krigování, jednoduchá metoda krigování a další známé interpolační techniky k mapování nebo předpovídání PTE, půdních charakteristik a půdních typů.
Algoritmy strojového učení (MLA) jsou relativně novou technikou, která využívá větší nelineární datové třídy, poháněná algoritmy primárně používanými pro dolování dat, identifikaci vzorů v datech a opakovaně aplikovaná na klasifikaci ve vědeckých oborech, jako jsou půdní vědy a úlohy s návratem. Četné výzkumné práce se spoléhají na modely MLA k predikci PTE v půdách, jako je Tan et al.22 (náhodné lesy pro odhad těžkých kovů v zemědělských půdách), Sakizadeh et al.23 (modelování pomocí podpůrných vektorových strojů a umělých neuronových sítí) znečištění půdy). Kromě toho Vega a kol.24 (CART pro modelování retence a adsorpce těžkých kovů v půdě) Sun et al.25 (aplikace kubismu je distribuce Cd v půdě) a další algoritmy, jako je k-nejbližší soused, generalizovaná zesílená regrese a zesílená regrese Stromy také aplikovaly MLA k predikci PTE v půdě.
Aplikace algoritmů DSM v predikci nebo mapování čelí několika výzvám. Mnoho autorů se domnívá, že MLA je lepší než geostatistika a naopak. Přestože jeden je lepší než druhý, kombinace těchto dvou zlepšuje úroveň přesnosti mapování nebo predikce v DSM15.Woodcock a Gopal26 Finke27;Pontius a Cheuk28 a Grunwald29 se vyjadřují k nedostatkům a některým chybám v předpovídaném mapování půdy. Půdní vědci zkoušeli různé techniky k optimalizaci účinnosti, přesnosti a předvídatelnosti mapování a předpovědí DSM. Kombinace nejistoty a ověřování je jedním z mnoha různých aspektů integrovaných do DSM za účelem optimalizace účinnosti a snížení defektů. Nicméně Agyeman et al.15 naznačují, že validační chování a nejistota zaváděná tvorbou a predikcí map by měla být nezávisle ověřena, aby se zlepšila kvalita mapy. Omezení DSM jsou způsobena geograficky rozptýlenou kvalitou půdy, která zahrnuje složku nejistoty;nedostatek jistoty v DSM však může pocházet z více zdrojů chyb, jmenovitě z kovariátové chyby, modelové chyby, lokační chyby a analytické chyby 31. Nepřesnosti modelování vyvolané v MLA a geostatistických procesech jsou spojeny s nedostatečným pochopením, což nakonec vede k přílišnému zjednodušení skutečného procesu32.Bez ohledu na povahu modelu lze parametry interpolace3 přisuzovat3 předpovědím, nepřesným modelovým modelům. Nedávno se objevil nový trend DSM, který podporuje integraci geostatistiky a MLA do mapování a předpovědí. Několik vědců a autorů půdy, jako je Sergeev et al.34;Subbotina a kol.35;Tarasov a kol.36 a Tarasov a kol.37 využili přesné kvality geostatistiky a strojového učení k vytvoření hybridních modelů, které zlepšují efektivitu předpovědí a mapování.kvalita. Některé z těchto hybridních nebo kombinovaných modelů algoritmů jsou umělé neuronové sítě krigování (ANN-RK), vícevrstvé zbytkové krigování perceptronů (MLP-RK), zbytkové krigování neuronové sítě zobecněné regrese (GR-NNRK)36, krigování umělé neuronové sítě-vícevrstvé perceptrony (ANN-K-MLP a Regression Process8)37.
Podle Sergeeva et al. má kombinace různých modelovacích technik potenciál eliminovat defekty a zvýšit efektivitu výsledného hybridního modelu spíše než vyvíjet jeho jediný model. V této souvislosti tento nový článek tvrdí, že je nutné použít kombinovaný algoritmus geostatistiky a MLA k vytvoření optimálních hybridních modelů pro predikci obohacení Ni v městských a příměstských oblastech. Tato studie se bude opírat o model Vector Bay (MKRIgingical Machine) a základní mix (MK EB Support) Ple modely lineární regrese (MLR).Hybridizace EBK s jakýmkoliv MLA není známa. Viděné vícenásobné smíšené modely jsou kombinacemi běžného, ​​zbytkového, regresního krigingu a MLA.EBK je geostatistická interpolační metoda, která využívá prostorově stochastický proces, který je lokalizován jako nestacionární/stacionární náhodné pole, včetně lokalizace K3 bylo použito pro různé parametry lokalizace39 pro různé parametry. distribuce organického uhlíku v zemědělských půdách40, hodnocení znečištění půdy41 a mapování půdních vlastností42.
Na druhou stranu, Self-Organizing Graph (SeOM) je algoritmus učení, který byl aplikován v různých článcích, jako je Li et al.43, Wang a kol.44, Hossain Bhuiyan a kol.45 a Kebonye et al.46 Určete prostorové atributy a seskupení prvků. Wang et al.44 naznačují, že SeOM je výkonná učební technika známá svou schopností seskupovat a představovat si nelineární problémy. Na rozdíl od jiných technik rozpoznávání vzorů, jako je analýza hlavních komponent, fuzzy shlukování, hierarchické shlukování a rozhodování podle více kritérií, je SeOM lepší v organizování a identifikaci vzorů PTE. Podle Wanga et al.44, SeOM může prostorově seskupovat distribuci příbuzných neuronů a poskytovat vizualizaci dat s vysokým rozlišením. SeOM bude vizualizovat data predikce Ni, aby získal nejlepší model pro charakterizaci výsledků pro přímou interpretaci.
Tento dokument si klade za cíl vytvořit robustní mapovací model s optimální přesností pro předpovídání obsahu niklu v městských a příměstských půdách. Předpokládáme, že spolehlivost smíšeného modelu závisí hlavně na vlivu dalších modelů připojených k základnímu modelu. Uznáváme výzvy, kterým DSM čelí, a přestože se tyto výzvy řeší na více frontách, kombinace pokroků v geostatistikách a modelech MLA se zdá být přírůstková;proto se pokusíme odpovědět na výzkumné otázky, které mohou přinést smíšené modely. Jak přesný je však model při predikci cílového prvku? Také, jaká je úroveň hodnocení účinnosti na základě validace a vyhodnocení přesnosti? Konkrétními cíli této studie proto bylo (a) vytvořit kombinovaný model směsi pro SVMR nebo MLR s použitím EBK jako základního modelu, (b) porovnat výsledné modely (urbánní) aplikace pro předpovědi nejlepší koncentrace půdy a půdy (c) navrhnout nejlepší koncentraci půdy a Ni-urbanu SeOM k vytvoření mapy prostorových variací niklu s vysokým rozlišením.
Studie probíhá v České republice, konkrétně v okrese Frýdek Místek v Moravskoslezském kraji (viz obrázek 1). Geografie studované oblasti je velmi členitá a je převážně součástí regionu Moravskoslezské Beskydy, který je součástí vnějšího okraje Karpat. Studovaná oblast se nachází mezi 49° 02′01′02′ E10 41′ E. nadmořská výška je mezi 225 a 327 m;Koppenův klasifikační systém pro klimatický stav regionu je však hodnocen jako Cfb = mírné oceánské podnebí, je zde mnoho srážek i v suchých měsících. Teploty se v průběhu roku mírně mění mezi -5 °C a 24 °C, zřídka klesnou pod -14 °C nebo nad 30 °C, přičemž průměrný roční úhrn srážek je mezi 6285 a 2 kilometry čtverečními, celková plocha průzkumu je 175 mm. 39,38 % obhospodařované půdy a 49,36 % lesního porostu. Na druhou stranu plocha použitá v této studii je cca 889,8 km2. V Ostravě a okolí je velmi aktivní ocelářský průmysl a kovoobrábění. Kovárny, ocelářský průmysl, kde se nikl používá v nerezových ocelích (např. pro odolnost proti atmosférickému použití při jeho dobré korozi) a pevnost slitiny jako hnojivo zvyšuje pevnost slitiny (niklový kelímek) a pevnost slitin fosfátů a živočišná výroba jsou výzkumnými potenciálními zdroji niklu v regionu (např. přidávání niklu do jehňat za účelem zvýšení rychlosti růstu u jehňat a skotu s nízkou výživou). Další průmyslové využití niklu ve výzkumných oblastech zahrnuje jeho použití při galvanickém pokovování, včetně galvanického pokovování niklem a procesů bezproudového pokovování niklem. Vlastnosti půdy lze snadno odlišit od barvy půdy, struktury a obsahu uhličitanu. Některé půdní oblasti se na povrchu a podloží objevují skvrnitě, často s betonem a vybělením. Nejčastějšími půdními typy v kraji jsou však kambizemě a stagnozemě48. S nadmořskými výškami od 455,1 do 493,5 m dominují v ČR kambizemě49.
Mapa studijní oblasti [Mapa studijní oblasti byla vytvořena pomocí ArcGIS Desktop (ESRI, Inc, verze 10.7, URL: https://desktop.arcgis.com).]
Celkem 115 vzorků ornice bylo získáno z městských a příměstských půd v okrese Frýdek Místek. Použitým vzorem vzorků byla pravidelná mřížka se vzorky půdy ve vzdálenosti 2 × 2 km od sebe a ornice byla měřena v hloubce 0 až 20 cm pomocí ručního GPS zařízení (Leica Zeno 5 GPS). vzorky, rozdrcené mechanickým systémem (Fritschův kotoučový mlýn) a prosévané (velikost síta 2 mm). 1 gram vysušených, homogenizovaných a prosetých vzorků půdy vložte do jasně označených teflonových lahví. Do každé teflonové nádobky nadávkujte 7 ml 35% HCl a 3 ml 65% HNO3 (pomocí automatického dávkovače nechejte přes noc odstát a přikryjte kyselým programem – jeden). Umístěte supernatant na horkou kovovou desku (teplota: 100 W a 160 °C) po dobu 2 hodin, aby se usnadnil proces trávení vzorků, poté ochlaďte. Přeneste supernatant do odměrné baňky o objemu 50 ml a zřeďte na 50 ml deionizovanou vodou. Poté přefiltrujte zředěný supernatant do zkumavky z 1 ml deionizované vody zředěné 9 ml PVC ml deionizované vody a přefiltrovány do zkumavky o objemu 12 ml připravené pro pseudokoncentraci PTE. Koncentrace PTE (As, Cd, Cr, Cu, Mn, Ni, Pb, Zn, Ca, Mg, K) byly stanoveny pomocí ICP-OES (Inductively Coupled Plasma Optical Emission Spectroscopy) (Metody Thermo Quality/Standard pro kontrolu kvality/AsQsurance Shoda Ensurance a C. ) postupy (SRM NIST 2711a Montana II Soil).PTE s detekčními limity nižšími než polovina byly z této studie vyloučeny. Detekční limit PTE použitý v této studii byl 0,0004.(vy). Kromě toho je proces kontroly kvality a zajištění kvality pro každou analýzu zajištěn analýzou referenčních standardů. Aby bylo zajištěno, že chyby byly minimalizovány, byla provedena dvojitá analýza.
Empirický Bayesian Kriging (EBK) je jednou z mnoha geostatistických interpolačních technik používaných při modelování v různých oblastech, jako je pedologie. Na rozdíl od jiných technik krigingové interpolace se EBK liší od tradičních metod krigingu tím, že bere v úvahu chybu odhadnutou semivariogramovým modelem. V EBK interpolaci je několik semivariogramových modelů počítáno spíše během semivariogramové interpolace a přidružené interpolační techniky pro interpolaci. vykreslení semivariogramu, který představuje vysoce komplexní část dostatečné krigingové metody. Proces interpolace EBK se řídí třemi kritérii navrženými Krivoruchkem50, (a) model odhaduje semivariogram ze vstupního datového souboru (b) nová predikovaná hodnota pro každé umístění vstupního datového souboru na základě vygenerovaného semivariogramu a (c) výsledná sada dat je vytvořena jako simulovaná rovnice modelu A je kompenzována
Kde \(Prob\left(A\right)\) představuje předchozí, \(Prob\left(B\right)\) je ve většině případů ignorována mezní pravděpodobnost, \(Prob (B,A)\ ). datový soubor pozorování ze semivariogramu.
Podpůrný vektorový stroj je algoritmus strojového učení, který generuje optimální oddělovací nadrovinu pro rozlišení identických, ale ne lineárně nezávislých tříd. Vapnik51 vytvořil algoritmus klasifikace záměrů, ale nedávno byl použit k řešení regresně orientovaných problémů. Podle Li et al.52 je SVM jednou z nejlepších klasifikačních technik a byl použit v různých oblastech regresní analýzy – SVMSport Vector.The regrese. Cherkassky a Mulier53 propagovali SVMR jako regresi založenou na jádře, jejíž výpočet byl proveden pomocí lineárního regresního modelu s prostorovými funkcemi pro více zemí.John et al54 uvádějí, že modelování SVMR využívá hyperplane lineární regresi, která vytváří nelineární vztahy a umožňuje prostorové funkce.Podle Vohland et al.55, epsilon (ε)-SVMR používá trénovanou datovou sadu k získání reprezentačního modelu jako funkce necitlivé na epsilon, která se aplikuje k mapování dat nezávisle s nejlepším epsilon vychýlením z trénování na korelovaných datech. Přednastavená chyba vzdálenosti je ignorována od skutečné hodnoty, a pokud je chyba větší než ε(ε), navrhované vlastnosti půdy ji kompenzují.Podpora trénovacích dat modelu je také snížena pomocí širokého vektoru rovnice. 1 je zobrazen níže.
kde b představuje skalární práh, \(K\left({x}_{,}{ x}_{k}\right)\) představuje funkci jádra, \(\alpha\) představuje Lagrangeův multiplikátor, N představuje číselnou datovou množinu, \({x}_{k}\) představuje datový vstup a \(y\) je datový výstup. Jednou z použitých operací je Gaussův radiální isnelový klíč. RBF jádro je aplikováno k určení optimálního SVMR modelu, který je kritický pro získání nejjemnějšího faktoru C penalizační sady a parametru jádra gamma (γ) pro trénovací data PTE. Nejprve jsme vyhodnotili trénovací sadu a poté testovali výkon modelu na ověřovací sadě. Použitý parametr řízení je sigma a hodnota metody je svmRadial.
Model vícenásobné lineární regrese (MLR) je regresní model, který představuje vztah mezi proměnnou odezvy a množstvím prediktorových proměnných pomocí lineárních sdružených parametrů vypočítaných metodou nejmenších čtverců. V MLR je model nejmenších čtverců prediktivní funkcí vlastností půdy po výběru vysvětlujících proměnných. Odezvu je nutné použít k vytvoření lineárního vztahu pomocí vysvětlujících proměnných. Jako vysvětlující proměnná byla použita lineární proměnná PTE jako vysvětlující proměnná.
kde y je proměnná odezvy, \(a\) je průsečík, n je počet prediktorů, \({b}_{1}\) je částečná regrese koeficientů, \({x}_{i}\) představuje prediktor nebo vysvětlující proměnnou a \({\varepsilon }_{i}\) představuje chybu v modelu, také známou jako reziduum.
Smíšené modely byly získány sendvičováním EBK s SVMR a MLR. To se provádí extrakcí predikovaných hodnot z interpolace EBK. Předpovězené hodnoty získané z interpolovaných Ca, K a Mg jsou získány kombinatorickým procesem pro získání nových proměnných, jako jsou CaK, CaMg a KMg. Prvky Ca, O ver K a KMg se pak získají všechny proměnné, Ca, čtvrtá jsou proměnná Ca. Mg, CaK, CaMg, KMg a CaKMg. Tyto proměnné se staly našimi prediktory, které pomáhají předpovídat koncentrace niklu v městských a příměstských půdách. Algoritmus SVMR byl proveden na prediktorech za účelem získání smíšeného modelu Empirický bayesovský Kriging-Support Vector Machine (EBK_SVM). Podobně lze získat i Empirický smíšený model pomocí KrigingM proměnných pro Empirický model MLR iple Linear Regression (EBK_MLR). Typicky se proměnné Ca, K, Mg, CaK, CaMg, KMg a CaKMg používají jako kovariáty jako prediktory obsahu Ni v městských a příměstských půdách. Získaný nejpřijatelnější model (EBK_SVM nebo EBK_MLR) bude poté vizualizován pomocí grafu.
Používání SeOM se stalo oblíbeným nástrojem pro organizování, vyhodnocování a předpovídání dat ve finančním sektoru, zdravotnictví, průmyslu, statistikách, pedologii a dalších. SeOM je vytvořen pomocí umělých neuronových sítí a metod učení bez dozoru pro organizaci, vyhodnocování a predikci. V této studii byl SeOM použit k vizualizaci koncentrací Ni na základě nejlepšího modelu pro predikci Ni v městských a příměstských,5M zpracovaných vektorových proměnných v půdách. ssen a kol.57 popisují připojení vstupního vektoru do neuronové sítě přes jedinou vstupní vrstvu k výstupnímu vektoru s jediným váhovým vektorem. Výstup generovaný SeOM je dvourozměrná mapa skládající se z různých neuronů nebo uzlů vetkaných do hexagonálních, kruhových nebo čtvercových topologických map podle jejich blízkosti. Porovnání velikostí map na základě metriky, kvantizační chyby (QE) a topografické chyby, která je vybrána,8004, je vybrána, v tomto pořadí,0906 TE. 55-mapová jednotka (5 × 11). Struktura neuronu je určena podle počtu uzlů v empirické rovnici
Počet dat použitých v této studii je 115 vzorků. K rozdělení dat na testovací data (25 % pro validaci) a tréninkové datové sady (75 % pro kalibraci) byl použit náhodný přístup. Tréninková datová sada se používá ke generování regresního modelu (kalibrace) a testovací datová sada se používá k ověření schopnosti opakovaného zobecňování58. To bylo provedeno k posouzení vhodnosti různých modelů obsahu, které byly použity v pětinásobných modelech pro předpovídání obsahu. .Proměnné vytvořené interpolací EBK se používají jako prediktory nebo vysvětlující proměnné k predikci cílové proměnné (PTE). Modelování je v RStudio řešeno pomocí knihovny balíčků (Kohonen), knihovny (caret), knihovny (modelr), knihovny (“e1071″), knihovny (“plyr”), knihovny (“caTools””), knihovny (“Melir”) a knihovny (”Meliver prospect).
Pro určení nejlepšího modelu vhodného pro predikci koncentrací niklu v půdě a pro vyhodnocení přesnosti modelu a jeho validace byly použity různé validační parametry. Hybridizační modely byly vyhodnoceny pomocí střední absolutní chyby (MAE), střední kvadratické chyby (RMSE) a stanovení R-squared nebo koeficientu (R2).R2 definuje rozptyl proporcí v odpovědi, reprezentovaný modelem regrese, reprezentovaný modelem regrese, modelem regrese a modelem rozptylu nezávislým měřítkem a modelem predikce. kvantitativní hodnota.Hodnota R2 musí být vysoká, aby bylo možné vyhodnotit nejlepší model směsi pomocí validačních parametrů, čím blíže je hodnota 1, tím vyšší je přesnost.Podle Li et al.59, hodnota kritéria R2 0,75 nebo vyšší je považována za dobrý prediktor;od 0,5 do 0,75 je přijatelná výkonnost modelu a pod 0,5 je nepřijatelná výkonnost modelu. Při výběru modelu pomocí metod hodnocení kritérií validace RMSE a MAE byly nižší získané hodnoty dostatečné a byly považovány za nejlepší volbu. Následující rovnice popisuje metodu ověření.
kde n představuje velikost pozorované hodnoty\({Y}_{i}\) představuje naměřenou odezvu a \({\widehat{Y}}_{i}\) také představuje předpokládanou hodnotu odezvy pro první i pozorování.
Statistické popisy prediktorových a odezvových proměnných jsou uvedeny v tabulce 1, zobrazující průměr, směrodatnou odchylku (SD), variační koeficient (CV), minimum, maximum, špičatost a šikmost. Minimální a maximální hodnoty prvků jsou v sestupném pořadí Mg < Ca < K < Ni a Ca < Mg < K < Ni, v tomto pořadí. předlisek Ni se světovým průměrem (29 mg/kg) a evropským průměrem (37 mg/kg) ukázal, že celkový vypočítaný geometrický průměr pro studovanou oblast byl v tolerovatelném rozmezí. Nicméně, jak ukazuje Kabata-Pendias11, srovnání průměrné periferní koncentrace niklu (Ni) v současné studii se zemědělskými půdami ve Švédsku ukazuje, že současná průměrná koncentrace niklu v městské a současné městské půdě Miktek je vyšší. Ni 16,15 mg/kg) bylo vyšší než přípustný limit 60 (10,2 mg/kg) pro Ni v polských městských půdách, který uvedli Różański et al. Kromě toho Bretzel a Calderisi61 zaznamenali velmi nízké průměrné koncentrace Ni (1,78 mg/kg) v městských půdách v Toskánsku (1,78 mg/kg) v Hongkongu ve srovnání se současnou studií zjistila nižší koncentrace niklu23 mg/kg. s, což je nižší než současná koncentrace niklu v této studii.Birke et al63 uvedli průměrnou koncentraci Ni 17,6 mg/kg ve staré těžební a městské průmyslové oblasti v Sasku-Anhaltsku v Německu, což bylo o 1,45 mg/kg vyšší než průměrná koncentrace Ni v této oblasti (16,15 mg/kg). Současný výzkum. Nadměrný obsah niklu v městských oblastech a železářském průmyslu mohou být způsobeny především studiem městského průmyslu a železářského průmyslu v půdách v železe a průmyslu. je v souladu se studií Khodadousta et al.64 uvádí, že hlavními zdroji kontaminace půd niklem jsou ocelářský průmysl a kovodělné zpracování. Předpovědi se však také pohybovaly od 538,70 mg/kg do 69 161,80 mg/kg pro Ca, 497,51 mg/kg do 3535,68 mg/kg pro K a 685,70 mg/kg do 59,68 mg/kg. .65 zkoumali celkový obsah Mg a K v půdách v centrálním Srbsku. Zjistili, že celkové koncentrace (410 mg/kg a 400 mg/kg, v tomto pořadí) byly nižší než koncentrace Mg a K v současné studii. Nerozlišitelné, ve východním Polsku Orzechowski a Smolczynski66 hodnotili celkový obsah Ca, Mg/kg a průměrné koncentrace Cag0 mg/kg a 90 mg/kg a 50 mg/kg K (810 mg/kg) Obsah v ornici je nižší než obsah jediného prvku v této studii. Nedávná studie Pongrac et al.67 ukázal, že celkový obsah Ca analyzovaný ve 3 různých půdách ve Skotsku ve Spojeném království (půda Mylnefield, půda Balruddery a půda Hartwood) ukázal v této studii vyšší obsah Ca.
Kvůli různým naměřeným koncentracím vzorkovaných prvků vykazují distribuce datových sad prvků různou šikmost. Šikmost a špičatost prvků se pohybovala od 1,53 do 7,24 a 2,49 až 54,16, v tomto pořadí. Všechny vypočítané prvky mají úroveň šikmosti a špičatosti vyšší než +1, což naznačuje, že rozložení dat v pravém a zkoseném směru prvků je také nepravidelné a šikmé. vykazují střední variabilitu, zatímco Ca má extrémně vysokou variabilitu. CV K, Ni a Mg vysvětlují jejich rovnoměrnou distribuci. Kromě toho je distribuce Ca nerovnoměrná a vnější zdroje mohou ovlivnit úroveň jeho obohacení.
Korelace prediktorových proměnných s prvky odezvy naznačovala uspokojivou korelaci mezi prvky (viz obrázek 3). Korelace ukázala, že CaK vykazoval mírnou korelaci s hodnotou r = 0,53, stejně jako CaNi. Přestože Ca a K vykazují mírné vzájemné vztahy, výzkumníci jako Kingston et al.68 a Santo69 naznačují, že jejich hladiny v půdě jsou nepřímo úměrné. Ca a Mg jsou však antagonistické ke K, ale CaK dobře koreluje. To může být způsobeno aplikací hnojiv, jako je uhličitan draselný, který je o 56 % vyšší v draslíku. Draslík mírně koreloval s hořčíkem (KM r = 0,63), protože tyto dva prvky jsou úzce spojeny s hořčíkem, draslíkem a draslíkem, síranem draselným. nikl mírně koreluje s Ca, K a Mg s hodnotami r = 0,52, 0,63 a 0,55, v tomto pořadí. Vztahy mezi vápníkem, hořčíkem a PTE, jako je nikl, jsou složité, ale přesto hořčík inhibuje absorpci vápníku, vápník snižuje účinky přebytku hořčíku a hořčík i vápník snižují toxické účinky niklu.
Korelační matice pro prvky ukazující vztah mezi prediktory a odpověďmi (Poznámka: tento obrázek zahrnuje bodový graf mezi prvky, hladiny významnosti jsou založeny na p < 0,001).
Obrázek 4 ilustruje prostorovou distribuci prvků.Podle Burgose et al70 je aplikace prostorové distribuce technikou používanou ke kvantifikaci a zvýraznění horkých míst ve znečištěných oblastech. Úrovně obohacení Ca na obrázku 4 lze vidět v severozápadní části mapy prostorového rozložení. Obrázek ukazuje střední až vysoké obohacení Ca2. použití v ocelárnách jako alkalický kyslík v procesu výroby oceli. Na druhou stranu jiní zemědělci preferují použití hydroxidu vápenatého v kyselých půdách k neutralizaci pH, což také zvyšuje obsah vápníku v půdě71. Draslík také ukazuje horká místa na severozápadě a východě mapy. Severozápad je hlavní zemědělská komunita a středně vysoký až vysoký vzor u aplikací Madadského potaše a draslíku může být způsoben dalšími aplikacemi MadPK a draslíku2. s et al. 73, Pulkrabová et al. 74, Asare et al. 75, kteří pozorovali, že stabilizace půdy a ošetření KCl a NPK vedly k vysokému obsahu K v půdě.Prostorové obohacení draslíkem na severozápadě distribuční mapy může být způsobeno používáním hnojiv na bázi draslíku, jako je chlorid draselný, síran draselný, dusičnan draselný, potaš a potaš ke zvýšení obsahu draslíku v chudých půdách.Zádorová et al.76 a Tlustoš a kol.77 nastínil, že aplikace hnojiv na bázi K zvýšila obsah K v půdě a z dlouhodobého hlediska by výrazně zvýšila obsah živin v půdě, zejména K a Mg vykazují horké místo v půdě. Relativně mírné horké skvrny na severozápadě mapy a jihovýchodě mapy. Koloidní fixace v půdě snižuje koncentraci hořčíku v půdě, jeho nedostatek draslíku v půdě způsobuje žluté chlorové rostliny. sulfát, síran hořečnatý a kieserit léčí nedostatky (rostliny vypadají fialově, červeně nebo hnědě, což ukazuje na nedostatek hořčíku) v půdách s normálním rozsahem pH6. Akumulace niklu na površích městských a příměstských půd může být způsobena antropogenní činností, jako je zemědělství a význam niklu při výrobě nerezové oceli78.
Prostorové rozložení prvků [mapa prostorového rozložení byla vytvořena pomocí ArcGIS Desktop (ESRI, Inc, verze 10.7, URL: https://desktop.arcgis.com).]
Výsledky modelového výkonnostního indexu pro prvky použité v této studii jsou uvedeny v tabulce 2. Na druhou stranu, RMSE a MAE pro Ni jsou oba blízké nule (0,86 RMSE, -0,08 MAE). Na druhou stranu jsou hodnoty RMSE i MAE pro K přijatelné. Predikce Ni byly shledány lepšími než výsledky Johna et al.54 pomocí synergického krigingu k predikci koncentrací S v půdě pomocí stejných shromážděných dat. Výstupy EBK, které jsme studovali, korelují s výstupy Fabijaczyka et al.41, Yan a kol.79, Beguin a kol.80, Adhikary a kol.81 a John a kol.82, zejména K a Ni.
Výkon jednotlivých metod pro predikci obsahu niklu v městských a příměstských půdách byl vyhodnocen pomocí výkonnosti modelů (tabulka 3). Validace modelu a vyhodnocení přesnosti potvrdilo, že prediktor Ca_Mg_K v kombinaci s modelem EBK SVMR přinesl nejlepší výkon. Kalibrační model Ca_Mg_K-EBK_SVMR model R2, střední střední kvadratická chyba (R2MA) a 95 střední kvadratická chyba (R2MA). mg/kg (RMSE) a 77,368 mg/kg (MAE) Ca_Mg_K-SVMR byla 0,663 (R2), 235,974 mg/kg (RMSE) a 166,946 mg/kg (MAE). Nicméně dobré hodnoty R2 byly získány pro Ca_Mg_K6-SV3 mg (Ca_K_Mg_K-SV6 mg) 43 = R2);jejich výsledky RMSE a MAE byly vyšší než výsledky pro Ca_Mg_K-EBK_SVMR (R2 0,637) (viz tabulka 3). Kromě toho jsou RMSE a MAE modelu Ca_Mg-EBK_SVMR (RMSE = 1664,64 a MAE = 1031,49), které jsou větší než u modelu Ca-1-37,5, resp. MR.Podobně RMSE a MAE modelu Ca_Mg-K SVMR (RMSE = 235,974 a MAE = 166,946) jsou o 2,5 a 2,2 větší než u pozorovaného Ca_Mg_K-EBK_SVMR RMSE a MAE. Kebonye a kol.46 a John a kol.54, čím blíže jsou RMSE a MAE k nule, tím lepší jsou výsledky.SVMR a EBK_SVMR mají vyšší kvantované hodnoty RSME a MAE. Bylo pozorováno, že odhady RSME byly konzistentně vyšší než hodnoty MAE, což indikovalo přítomnost odlehlých hodnot. Podle Legates a McCabe83 je rozsah, v jakém RMSE doporučená hodnota přesahuje absolutní průměrnou chybu. heterogenní soubor dat, tím vyšší hodnoty MAE a RMSE. Přesnost hodnocení křížové validace smíšeného modelu Ca_Mg_K-EBK_SVMR pro predikci obsahu Ni v městských a příměstských půdách byla 63,70 %.Podle Li et al.59, tato úroveň přesnosti je přijatelnou mírou výkonnosti modelu. Současné výsledky jsou porovnány s předchozí studií Tarasova et al.36, jehož hybridní model vytvořil MLPRK (Multilayer Perceptron Residual Kriging), související s indexem hodnocení přesnosti EBK_SVMR uvedeným v současné studii, RMSE (210) a The MAE (167,5) byl vyšší než naše výsledky v současné studii (RMSE 95,479, MAE 77,368). .36 (0,544), je zřejmé, že koeficient determinace (R2) je v tomto smíšeném modelu vyšší. Rozpětí chyb (RMSE a MAE) (EBK SVMR) pro smíšený model je dvakrát nižší. Stejně tak Sergeev et al.34 zaznamenali 0,28 (R2) pro vyvinutý hybridní model (Multilayer Perceptron Residual, zatímco studie predikce63 zaznamenala úroveň rezidua Krigingron2 v Krigingron2 aktuální přesnosti.0). tento model (EBK SVMR) je 63,7 %, zatímco přesnost predikce získaná Sergeevem et al.34 je 28 %. Finální mapa (obr. 5) vytvořená pomocí modelu EBK_SVMR a Ca_Mg_K jako prediktoru ukazuje předpovědi horkých míst a středních až niklových v celé studované oblasti. To znamená, že koncentrace niklu ve studované oblasti je převážně mírná, s vyššími koncentracemi v některých specifických oblastech.
Finální predikční mapa je reprezentována pomocí hybridního modelu EBK_SVMR a pomocí Ca_Mg_K jako prediktoru.[Mapa prostorového rozložení byla vytvořena pomocí RStudio (verze 1.4.1717: https://www.rstudio.com/).]
Na obrázku 6 jsou uvedeny koncentrace PTE jako rovina kompozice sestávající z jednotlivých neuronů. Žádná z rovin složek nevykazovala stejný barevný vzor, ​​jak je znázorněno. Příslušný počet neuronů na nakreslenou mapu je však 55. SeOM se vyrábí za použití různých barev a čím jsou barevné vzory podobnější, tím jsou vlastnosti vzorků srovnatelnější. Podle jejich přesné barevné škály vykazovaly jednotlivé neurony vysoké barvy, jednotlivé prvky a Mg low (C) podobné barevné vzory. , CaK a CaMg sdílejí určité podobnosti s neurony velmi vysokého řádu a nízkými až středními barevnými vzory. Oba modely předpovídají koncentraci Ni v půdě zobrazením středních až vysokých odstínů barev, jako je červená, oranžová a žlutá. Model KMg zobrazuje mnoho vysoce barevných vzorů založených na přesných proporcích a nízké až střední barevné skvrny. Na přesné barevné škále od nízké k vysoké koncentraci ukazuje obrázek plošné rozložení složek v půdě. ).Rovina komponent modelu CakMg ukazuje různý barevný vzor od nízké po vysokou podle přesné barevné škály. Kromě toho je predikce obsahu niklu (CakMg) v modelu podobná prostorové distribuci niklu znázorněné na obrázku 5. Oba grafy ukazují vysoké, střední a nízké podíly koncentrací niklu v městských a příměstských půdách, rozdělených do tří hodnot k-modelu na mapě každého shluku. .Konturová metoda představuje optimální počet shluků.Ze 115 odebraných půdních vzorků získala kategorie 1 nejvíce půdních vzorků, 74.Shluk 2 obdržel 33 vzorků, zatímco shluk 3 obdržel 8 vzorků. Kombinace sedmisložkového planárního prediktoru byla zjednodušena, aby umožnila správnou interpretaci shluků. Vzhledem k četným antropogenním a přírodním procesům je obtížné správně rozmístit různé vzory shluků v půdě.78
Výstup roviny komponent každou proměnnou Empirical Bayesian Kriging Support Vector Machine (EBK_SVM_SeOM).[Mapy SeOM byly vytvořeny pomocí RStudio (verze 1.4.1717: https://www.rstudio.com/).]
Různé komponenty klasifikace clusteru [Mapy SeOM byly vytvořeny pomocí RStudio (verze 1.4.1717: https://www.rstudio.com/).]
Současná studie jasně ilustruje techniky modelování koncentrací niklu v městských a příměstských půdách. Studie testovala různé techniky modelování, kombinující prvky s modelovacími technikami, aby se získal nejlepší způsob, jak předpovídat koncentrace niklu v půdě. SeOM kompoziční rovinné prostorové rysy modelovací techniky vykazovaly vysoký barevný vzor od nízké po vysokou na přesné barevné škále, což ukazuje koncentrace Ni v půdě (Nicméně prostorové rozložení složek potvrzuje obrázek KEB5. Výsledky ukazují, že podpůrný vektorový strojový regresní model (Ca Mg K-SVMR) předpovídá koncentraci Ni v půdě jako jediný model, ale parametry validace a vyhodnocení přesnosti vykazují velmi vysoké chyby ve smyslu RMSE a MAE. Na druhou stranu technika modelování použitá s modelem EBK_MLR je také chybná z důvodu nízké hodnoty MK a kombinovaného koeficientu determinace prvků KVSEg získaných s použitím prvků KCSVGod (R2). a MAE chyby s přesností 63,7 %. Ukazuje se, že zkombinováním algoritmu EBK s algoritmem strojového učení lze vytvořit hybridní algoritmus, který dokáže předpovídat koncentraci PTE v půdě. Výsledky ukazují, že použití Ca Mg K jako prediktorů pro předpovídání koncentrací Ni ve studované oblasti může zlepšit předpověď Ni v půdě tím, že průmyslová aplikace průmyslových hnojiv na bázi niklu zvyšuje znečištění půdy a průmyslová hnojiva. nikl v půdě. Tato studie odhalila, že model EBK může snížit úroveň chyb a zlepšit přesnost modelu prostorového rozložení půdy v městských nebo příměstských půdách. Obecně navrhujeme použít model EBK-SVMR k posouzení a predikci PTE v půdě;navíc navrhujeme použít EBK k hybridizaci s různými algoritmy strojového učení. Koncentrace Ni byly předpovězeny pomocí prvků jako kovariát;použití více kovariát by však výrazně zlepšilo výkonnost modelu, což lze považovat za omezení současné práce. Dalším omezením této studie je, že počet datových sad je 115. Pokud je tedy poskytnuto více dat, lze výkon navrhované optimalizované hybridizační metody zlepšit.
PlantProbs.net.Nickel in Plants and Soil https://plantprobs.net/plant/nutrientImbalances/sodium.html (Přístup 28. dubna 2021).
Kasprzak, KS Nikl postupuje v moderní environmentální toxikologii.okolí.toxikologii.11, 145–183 (1987).
Cempel, M. & Nikel, G. Nickel: Přehled jeho zdrojů a environmentální toxikologie. Polský J. Environment. Stud. 15, 375–382 (2006).
Freedman, B. & Hutchinson, TC Vstup znečišťujících látek z atmosféry a akumulace v půdě a vegetaci poblíž nikl-měděné huti v Sudbury, Ontario, Kanada.can.J.Bot.58(1), 108-132.https://doi.org/10.1139/b80-014 (1980).
Manyiwa, T. et al. Těžké kovy v půdě, rostlinách a rizika spojená s pastvou přežvýkavců poblíž měděnoniklového dolu Selebi-Phikwe v Botswaně.surroundings.Geochemistry.Health https://doi.org/10.1007/s10653-021-00921-x).
Cabata-Pendias.Kabata-Pendias A. 2011. Stopové prvky v půdě a… – Google Scholar https://scholar.google.com/scholar?hl=cs&as_sdt=0%2C5&q=Kabata-Pendias+A.+2011.+Trace+ Elements+in+Yorsoil.+%+New+th+Yorsoil.+% 9%3A+CRC+Press&btnG= (přístup 24. listopadu 2020).
Almås, A., Singh, B., Zemědělství, TS-NJ z & 1995, nedefinováno. Účinky ruského niklového průmyslu na koncentrace těžkých kovů v zemědělských půdách a trávách v Soer-Varanger, Norsko.agris.fao.org.
Nielsen, GD et al. Absorpce a retence niklu v pitné vodě souvisí s příjmem potravy a citlivostí na nikl. toxikologie. aplikace. farmakodynamika. 154, 67–75 (1999).
Costa, M. & Klein, CB Karcinogeneze niklu, mutace, epigenetika nebo selekce.okolí.Health Perspective.107, 2 (1999).
Ajman, PC;Ajado, SK;Borůvka, L.;Bini, JKM;Sarkody, VYO;Cobonye, ​​NM;Analýza trendů potenciálně toxických prvků: bibliometrický přehled. Environmentální geochemie a zdraví. Springer Science & Business Media BV 2020. https://doi.org/10.1007/s10653-020-00742-9.
Minasny, B. & McBratney, AB Digital Soil Mapping: A Brief History and Some Lessons.Geoderma 264, 301–311.https://doi.org/10.1016/j.geoderma.2015.07.017 (2016).
McBratney, AB, Mendonça Santos, ML & Minasny, B. O digitálním mapování půdy. Geoderma 117(1-2), 3-52.https://doi.org/10.1016/S0016-7061(03)00223-4 (2003).
Deutsch.CV Geostatistical Reservoir Modeling,… – Google Scholar https://scholar.google.com/scholar?hl=cs&as_sdt=0%2C5&q=CV+Deutsch%2C+2002%2C+Geostatistical+Reservoir+Modeling%2C +Oxfords+University%2Cb+page. vydáno 28. dubna 2021).


Čas odeslání: 22. července 2022