Прогнозиране на концентрациите на никел в крайградски и градски почви с помощта на смесен емпиричен байесов кригинг и опорна векторна машинна регресия

Благодарим ви, че посетихте Nature.com. Версията на браузъра, която използвате, има ограничена поддръжка за CSS. За най-добро изживяване ви препоръчваме да използвате актуализиран браузър (или да изключите режима на съвместимост в Internet Explorer). Междувременно, за да осигурим непрекъсната поддръжка, ние ще показваме сайта без стилове и JavaScript.
Замърсяването на почвата е голям проблем, причинен от човешки дейности. Пространственото разпределение на потенциално токсични елементи (PTEs) варира в повечето градски и крайградски райони. Следователно е трудно пространствено да се предвиди съдържанието на PTEs в такива почви. Общо 115 проби са получени от Frydek Mistek в Чешката република. Концентрациите на калций (Ca), магнезий (Mg), калий (K) и никел (Ni) са определени с помощта на индуктивно свързана плазмена емисионна спектрометрия. Променливата на отговора е Ni, а предикторите са Ca, Mg и K. Корелационната матрица между променливата на отговора и променливата на предиктора показва задоволителна корелация между елементите. Резултатите от прогнозата показаха, че опорната векторна машинна регресия (SVMR) се представи добре, въпреки че нейната изчислена средна квадратична грешка (RMSE) (235,974 mg/kg) и средна абсолютна грешка (MA) E) (166,946 mg/kg) са по-високи от другите приложени методи. Смесените модели за емпирична байесова кригинг-множествена линейна регресия (EBK-MLR) се представят слабо, както се вижда от коефициенти на определяне, по-малки от 0,1. Моделът на емпирична байесова кригинг-поддържаща векторна машинна регресия (EBK-SVMR) беше най-добрият модел с ниска RMSE (95,479 mg/ kg) и MAE (77,368 mg/kg) стойности и висок коефициент на детерминация (R2 = 0,637). Резултатът от техниката за моделиране на EBK-SVMR се визуализира с помощта на самоорганизираща се карта. Групираните неврони в равнината на компонента CakMg-EBK-SVMR на хибридния модел показват множество цветови модели, които предсказват концентрациите на Ni в градски и крайградски почви. Резултатите показват, че комбинирането на EBK и SVMR е ефективна техника за прогнозиране на концентрации на Ni в градски и крайградски почви.
Никелът (Ni) се счита за микроелемент за растенията, тъй като допринася за фиксирането на атмосферния азот (N) и метаболизма на уреята, като и двата са необходими за покълването на семената. В допълнение към приноса си за покълването на семената, Ni може да действа като гъбичен и бактериален инхибитор и да насърчава развитието на растенията. Липсата на никел в почвата позволява на растението да го абсорбира, което води до хлороза на листата. Например, кравешкият грах и зеленият фасул изискват приложение на никелови торове за оптимизиране на азотната фиксация2. Продължаващото прилагане на никелови торове за обогатяване на почвата и увеличаване на способността на бобовите растения да фиксират азот в почвата непрекъснато увеличава концентрацията на никел в почвата. Въпреки че никелът е микроелемент за растенията, прекомерният му прием в почвата може да причини повече вреда, отколкото полза. Токсичността на никела в почвата е минимална повишава рН на почвата и възпрепятства усвояването на желязото като основно хранително вещество за растежа на растенията1. Според Liu3 е установено, че Ni е 17-ият важен елемент, необходим за развитието и растежа на растенията. В допълнение към ролята на никела в развитието и растежа на растенията, хората се нуждаят от него за различни приложения. Галванопластиката, производството на сплави на основата на никел и производството на устройства за запалване и запалителни свещи в автомобилната индустрия изискват използване на никел в различни промишлени сектори. В допълнение, сплавите на основата на никел и галванизираните артикули са били широко използвани в кухненски съдове, аксесоари за бални зали, консумативи за хранително-вкусовата промишленост, електротехника, жици и кабели, реактивни турбини, хирургически импланти, текстил и корабостроене5. Богатите на Ni нива в почвите (т.е. повърхностни почви) се приписват както на антропогенни, така и на природни източници, но преди всичко Ni е естествен източник, а не антропогенен pogenic4,6.Естествените източници на никел включват вулканични изригвания, растителност, горски пожари и геоложки процеси;антропогенните източници обаче включват никелови/кадмиеви батерии в стоманодобивната промишленост, галванопластика, електродъгово заваряване, дизелово гориво и горивни масла и атмосферни емисии от изгаряне на въглища и изгаряне на отпадъци и утайки. Натрупване на никел7,8. Според Freedman и Hutchinson9 и Manyiwa et al.10, основните източници на замърсяване на горния почвен слой в непосредствена и съседна околна среда са предимно топилни заводи и мини на основата на никел-мед. Горната почва около никел-медната рафинерия Съдбъри в Канада има най-високи нива на замърсяване с никел от 26 000 mg/kg11. За разлика от това, замърсяването от производството на никел в Русия е довело до по-високи концентрации на никел в норвежката почва11. ing на Алмс и др.12, количеството HNO3-извличащ се никел в най-обработваемата земя в региона (производство на никел в Русия) варира от 6,25 до 136,88 mg/kg, което съответства на средна стойност от 30,43 mg/kg и базова концентрация от 25 mg/kg. Според kabata 11, прилагането на фосфорни торове в земеделски почви в градски или крайградски почви по време на последователни cr оперативните сезони могат да влеят или замърсят почвата. Потенциалните ефекти на никела при хората могат да доведат до рак чрез мутагенеза, хромозомни увреждания, генериране на Z-ДНК, блокирано изрязване на ДНК или епигенетични процеси13. При експерименти с животни е установено, че никелът има потенциал да причини различни тумори, а канцерогенните никелови комплекси могат да обострят такива тумори.
Оценките на замърсяването на почвата процъфтяват напоследък поради широк спектър от проблеми, свързани със здравето, произтичащи от взаимоотношенията почва-растение, биологичните връзки между почвата и почвата, екологичната деградация и оценката на въздействието върху околната среда. Към днешна дата пространственото прогнозиране на потенциално токсични елементи (PTE) като Ni в почвата е трудоемко и отнема много време, като се използват традиционни методи. Появата на дигиталното картографиране на почвата (DSM) и сегашният му успех15 имат голям успех значително подобрено предсказуемо почвено картографиране (PSM). Според Minasny и McBratney16 предсказуемото почвено картографиране (DSM) се е доказало като видна поддисциплина на науката за почвата. Lagacherie и McBratney, 2006 дефинират DSM като „създаване и попълване на пространствени почвени информационни системи чрез използване на in situ и лабораторни методи за наблюдение и пространствени и непространствени почвени изводи системи”.McBratney et al.17 очертават, че съвременният DSM или PSM е най-ефективната техника за прогнозиране или картографиране на пространственото разпределение на PTEs, типове почви и свойства на почвата. Геостатистиката и алгоритмите за машинно обучение (MLA) са техники за моделиране на DSM, които създават дигитализирани карти с помощта на компютри, използващи значителни и минимални данни.
Deutsch18 и Olea19 определят геостатистиката като „колекция от числени техники, които се занимават с представянето на пространствени атрибути, като използват главно стохастични модели, като например как анализът на времевите редове характеризира времевите данни“.На първо място, геостатистиката включва оценка на вариограми, които позволяват количествено определяне и дефиниране на зависимостите на пространствените стойности от всеки набор от данни20.Gumiaux et al.20 допълнително илюстрират, че оценката на вариограмите в геостатистиката се основава на три принципа, включително (a) изчисляване на мащаба на корелацията на данните, (b) идентифициране и изчисляване на анизотропията в несъответствието в набора от данни и (c) в допълнение към вземането под внимание на присъщата грешка на данните от измерването, отделени от локалните ефекти, се оценяват и ефектите на площта. Въз основа на тези концепции в геостатистиката се използват много техники за интерполация, включително общ кригинг, ко-кригинг, обикновен кригинг, емпиричен байесов кригинг, прост метод на кригинг и други добре известни техники за интерполация за картографиране или прогнозиране на PTE, характеристики на почвата и видове почви.
Алгоритмите за машинно обучение (MLA) са сравнително нова техника, която използва по-големи нелинейни класове данни, подхранвани от алгоритми, използвани основно за извличане на данни, идентифициране на модели в данни и многократно прилагани за класифициране в научни области като почвознание и задачи за връщане. Множество изследователски статии разчитат на MLA модели за прогнозиране на PTE в почви, като Tan et al.22 (случайни гори за оценка на тежки метали в земеделски почви), Sakizadeh et al.23 (моделиране с помощта на опорни векторни машини и изкуствени невронни мрежи) замърсяване на почвата). В допълнение, Vega et al.24 (CART за моделиране на задържане и адсорбция на тежки метали в почвата) Sun et al.25 (приложението на кубизма е разпределението на Cd в почвата) и други алгоритми като k-най-близкия съсед, генерализирана усилена регресия и усилена регресия Дърветата също приложиха MLA за прогнозиране на PTE в почвата.
Прилагането на DSM алгоритми при прогнозиране или картографиране е изправено пред няколко предизвикателства. Много автори смятат, че MLA превъзхожда геостатистиката и обратното. Въпреки че едното е по-добро от другото, комбинацията от двете подобрява нивото на точност на картографиране или прогнозиране в DSM15. Уудкок и Гопал26 Финке27;Pontius и Cheuk28 и Grunwald29 коментират недостатъците и някои грешки в прогнозираното почвено картографиране. Почвените учени са опитали различни техники за оптимизиране на ефективността, точността и предвидимостта на DSM картографирането и прогнозирането. Комбинацията от несигурност и проверка е един от многото различни аспекти, интегрирани в DSM за оптимизиране на ефективността и намаляване на дефектите. Въпреки това, Agyeman et al.15 очертават, че поведението при валидиране и несигурността, въведени от създаването на карта и прогнозирането, трябва да бъдат независимо валидирани, за да се подобри качеството на картата. Ограниченията на DSM се дължат на географски разпръснатото качество на почвата, което включва компонент на несигурност;въпреки това, липсата на сигурност в DSM може да възникне от множество източници на грешка, а именно ковариантна грешка, грешка на модела, грешка на местоположението и аналитична грешка 31. Неточностите при моделиране, предизвикани в MLA и геостатистическите процеси, са свързани с липса на разбиране, което в крайна сметка води до прекалено опростяване на реалния процес32. Независимо от естеството на моделирането, неточностите могат да бъдат приписани на параметрите на моделиране, математиката прогнози на математически модели или интерполация33. Напоследък се появи нова DSM тенденция, която насърчава интегрирането на геостатистиката и MLA в картографирането и прогнозирането. Няколко почвени учени и автори, като Sergeev et al.34;Суботина и др.35;Тарасов и др.36 и Tarasov et al.37 са използвали точното качество на геостатистиката и машинното обучение, за да генерират хибридни модели, които подобряват ефективността на прогнозирането и картографирането.Някои от тези хибридни или комбинирани алгоритъмни модели са Кригинг с изкуствена невронна мрежа (ANN-RK), Остатъчен кригинг с многослоен персептрон (MLP-RK), Остатъчен кригинг с невронна мрежа с генерализирана регресия (GR-NNRK)36, Кригинг с изкуствена невронна мрежа-Многослоен персептрон (ANN-K-MLP)37 и кокригинг и регресия на процеса на Гаус йон38.
Според Sergeev et al., комбинирането на различни техники за моделиране има потенциала да елиминира дефектите и да повиши ефективността на получения хибриден модел, вместо да разработи негов единичен модел. В този контекст тази нова статия твърди, че е необходимо да се приложи комбиниран алгоритъм от геостатистика и MLA за създаване на оптимални хибридни модели за прогнозиране на обогатяване на Ni в градските и крайградските райони. Това проучване ще разчита на емпиричния Bayesian Kriging (EBK) като основен модел и го смесете с поддържащи векторни машини (SVM) и модели на множествена линейна регресия (MLR). Хибридизацията на EBK с който и да е MLA не е известна. Множеството смесени модели, които се наблюдават, са комбинации от обикновен, остатъчен, регресионен кригинг и MLA. EBK е метод на геостатистическа интерполация, който използва пространствено стохастичен процес, който е локализиран като нестационарно/стационарно произволно поле с дефинирани параметри на локализация над полето, позволявайки пространствени вариации39. EBK е използван в различни изследвания, включително анализиране на разпределението на органичния въглерод в почвите на фермите40, оценка на замърсяването на почвата41 и картографиране на свойствата на почвата42.
От друга страна, Self-Organizing Graph (SeOM) е алгоритъм за обучение, който е приложен в различни статии като Li et al.43, Wang et al.44, Hossain Bhuiyan и др.45 и Kebonye et al.46 Определете пространствените атрибути и групирането на елементите. Wang et al.44 очертават, че SeOM е мощна техника за обучение, известна със способността си да групира и представя нелинейни проблеми. За разлика от други техники за разпознаване на образи като анализ на главните компоненти, размито групиране, йерархично групиране и вземане на многокритериални решения, SeOM е по-добър в организирането и идентифицирането на PTE модели. Според Wang et al.44, SeOM може пространствено да групира разпределението на свързани неврони и да осигури визуализация на данни с висока разделителна способност. SeOM ще визуализира данни за прогнозиране на Ni, за да получи най-добрия модел за характеризиране на резултатите за директна интерпретация.
Този документ има за цел да генерира стабилен картографски модел с оптимална точност за прогнозиране на съдържанието на никел в градските и крайградските почви. Ние предполагаме, че надеждността на смесения модел зависи главно от влиянието на други модели, прикрепени към базовия модел. Ние признаваме предизвикателствата пред DSM и докато тези предизвикателства се разглеждат на множество фронтове, комбинацията от напредъка в геостатистиката и моделите MLA изглежда нарастваща ;следователно ще се опитаме да отговорим на изследователски въпроси, които могат да доведат до смесени модели. Въпреки това, колко точен е моделът при прогнозиране на целевия елемент? Също така, какво е нивото на оценка на ефективността въз основа на валидиране и оценка на точността? Следователно специфичните цели на това проучване бяха (а) да се създаде модел на комбинирана смес за SVMR или MLR, използвайки EBK като основен модел, (б) да се сравнят получените модели (в) да се предложи най-добрият модел на смес за прогнозиране на концентрациите на Ni в града или околоградски почви, и (d) прилагането на SeOM за създаване на карта с висока разделителна способност на пространствената вариация на никела.
Проучването се провежда в Чешката република, по-специално в областта Фридек Мистек в региона на Моравия-Силезия (вижте Фигура 1). Географията на района на изследване е много неравна и е предимно част от региона на Моравия-Силезия Бескиди, който е част от външния ръб на Карпатите. Районът на изследване се намира между 49° 41′ 0′ N и 18° 20′ 0 ′ E, а надморската височина е между 225 и 327 m;въпреки това класификационната система на Koppen за климатичното състояние на региона се оценява като Cfb = умерен океански климат. Има много валежи дори през сухите месеци. Температурите варират леко през годината между −5 °C и 24 °C, като рядко падат под −14 °C или над 30 °C, докато средните годишни валежи са между 685 и 752 mm47. Прогнозната площ на изследването на цялата област е 1208 квадратни километра, с 39,38% от обработваемата земя и 49,36% от горското покритие. От друга страна, площта, използвана в това проучване, е около 889,8 квадратни километра. В и около Острава стоманодобивната промишленост и металургичните работи са много активни. Метални мелници, стоманодобивната промишленост, където никелът се използва в неръждаеми стомани (напр. за устойчивост на атмосферна корозия) и легирани стомани (никелът увеличава силата на сплавта, като същевременно се поддържа нейната добра пластичност и издръжливост) и интензивното земеделие като прилагане на фосфатни торове и животновъдството са изследователски потенциални източници на никел в региона (напр. добавяне на никел към агнета за увеличаване на темповете на растеж при агнета и слабо хранени говеда). Други промишлени употреби на никел в изследователски области включват използването му в галванопластика, включително галванопластика на никел и електролитно никелиране процеси на обшивка. Свойствата на почвата се различават лесно от цвета, структурата и съдържанието на карбонат в почвата. Текстурата на почвата е средна до фина, получена от основния материал. Те са колувиални, алувиални или еолични по природа. Някои почвени зони изглеждат на петна по повърхността и подпочвата, често с бетон и избелване. Въпреки това, камбисолите и стагнозолите са най-често срещаните типове почви в региона48. надморска височина, варираща от 455,1 до 493,5 m, камбисолите доминират в Чешката република49.
Карта на района на изследване [Картата на района на изследване е създадена с помощта на ArcGIS Desktop (ESRI, Inc, версия 10.7, URL: https://desktop.arcgis.com).]
Бяха получени общо 115 проби от горния слой на почвата от градски и крайградски почви в района на Frydek Mistek. Използваният образец на пробите беше правилна решетка с почвени проби, разположени на разстояние 2 × 2 km една от друга, и горният слой на почвата беше измерен на дълбочина от 0 до 20 cm с помощта на ръчно GPS устройство (Leica Zeno 5 GPS). Пробите са опаковани в торби Ziploc, правилно етикетирани и изпратени до лабораторията. s бяха изсушени на въздух, за да се получат пулверизирани проби, пулверизирани чрез механична система (дискова мелница на Fritsch) и пресети (размер на ситото 2 mm). Поставете 1 грам изсушени, хомогенизирани и пресети почвени проби в ясно етикетирани тефлонови бутилки. Във всеки тефлонов съд разпръснете 7 ml 35% HCl и 3 ml 65% HNO3 (с помощта на автоматичен дозатор – по един за всяка киселина), покрийте леко и оставете пробите да престоят една нощ за реакцията (програма царска вода). Поставете супернатантата върху гореща метална плоча (температура: 100 W и 160 °C) за 2 часа, за да улесните процеса на смилане на пробите, след това охладете. Прехвърлете супернатантата в мерителна колба от 50 ml и разредете до 50 ml с дейонизирана вода. След това филтрирайте разредената супернатанта в 5 0 ml PVC епруветка с дейонизирана вода. Освен това 1 ml от разтвора за разреждане се разрежда с 9 ml дейонизирана вода и се филтрува в 12 ml епруветка, подготвена за PTE псевдоконцентрация. Концентрациите на PTEs (As, Cd, Cr, Cu, Mn, Ni, Pb, Zn, Ca, Mg, K) се определят чрез ICP-OES (индуктивно свързан плазмен оптичен емисионен спектро scopy) (Thermo Fisher Scientific, САЩ) съгласно стандартни методи и споразумение. Осигурете процедури за осигуряване и контрол на качеството (QA/QC) (SRM NIST 2711a Montana II Soil). PTEs с граници на откриване под половината бяха изключени от това проучване. Границата на откриване на PTE, използвана в това проучване, беше 0,0004.(вие). Освен това контролът на качеството и процесът на осигуряване на качеството за всеки анализ се осигурява от анален yzing референтни стандарти. За да се гарантира, че грешките са сведени до минимум, беше извършен двоен анализ.
Емпиричният байесов кригинг (EBK) е една от многото техники за геостатистическа интерполация, използвани при моделиране в различни области като почвознание. За разлика от други техники за интерполация на кригинг, EBK се различава от традиционните методи на кригинг, като взема предвид грешката, изчислена от модела на семивариограмата. При интерполацията на EBK няколко модела на семивариограма се изчисляват по време на интерполация, а не една семивариограма. Техниките на интерполация правят път за несигурност и програмиране, свързано с това начертаване на семивариограмата, което представлява изключително сложна част от достатъчен кригин метод. Процесът на интерполация на EBK следва трите критерия, предложени от Krivoruchko50, (a) моделът оценява семивариограмата от входния набор от данни (b) новата прогнозирана стойност за всяко местоположение на входния набор от данни въз основа на генерираната полувариограма и (c) крайният A модел се изчислява от симулиран набор от данни. Правилото на байесовото уравнение е дадено като постериорно
Където \(Prob\left(A\right)\) представлява предишната, \(Prob\left(B\right)\) пределната вероятност се игнорира в повечето случаи, \(Prob (B,A)\ ). Изчислението на полувариограмата се основава на правилото на Bayes, което показва склонността на наборите от данни за наблюдение, които могат да бъдат създадени от полувариограми. След това стойността на полувариограмата се определя с помощта на правилото на Bayes, което гласи колко е вероятно да се създаде набор от данни от наблюдения от полувариограмата.
Машината за поддържащ вектор е алгоритъм за машинно обучение, който генерира оптимална разделителна хиперравнина за разграничаване на идентични, но не линейно независими класове. Vapnik51 създаде алгоритъма за класифициране на намеренията, но наскоро беше използван за решаване на регресионно-ориентирани проблеми. Според Li et al.52, SVM е една от най-добрите техники за класификатор и се използва в различни области. SVMR) беше използван в този анализ. Cherkassky и ​​Mulier53 са пионери в SVMR като регресия, базирана на ядрото, чието изчисление е извършено с помощта на линеен регресионен модел с пространствени функции за множество държави. John et al54 съобщават, че моделирането на SVMR използва хиперравнинна линейна регресия, която създава нелинейни връзки и позволява пространствени функции. Според Vohland et al.55, epsilon (ε)-SVMR използва обучения набор от данни, за да получи модел на представяне като функция, нечувствителна към епсилон, която се прилага за картографиране на данните независимо с най-доброто отклонение на епсилон от обучение върху корелирани данни. Предварително зададената грешка на разстоянието се игнорира от действителната стойност и ако грешката е по-голяма от ε(ε), свойствата на почвата я компенсират. Моделът също така намалява сложността на данните за обучение до по-широко подмножество от опорни вектори. Уравнението, предложено от Vapnik51, е показано по-долу.
където b представлява скаларния праг, \(K\left({x}_{,}{ x}_{k}\right)\) представлява функцията на ядрото, \(\alpha\) представлява умножителя на Лагранж, N представлява числов набор от данни, \({x}_{k}\) представлява въвеждане на данни и \(y\) е изход на данни. Едно от ключовите използвани ядра е операцията SVMR, която е гауссов радиал базова функция (RBF). Ядрото на RBF се прилага за определяне на оптималния SVMR модел, който е от решаващо значение за получаване на най-финия коефициент на наказателен набор C и параметър на ядрото гама (γ) за данните за обучение на PTE. Първо, ние оценихме набора за обучение и след това тествахме производителността на модела върху набора за валидиране. Използваният параметър за управление е сигма, а стойността на метода е svmRadial.
Множественият линеен регресионен модел (MLR) е регресионен модел, който представя връзката между променливата на отговора и редица предикторни променливи чрез използване на линейни обединени параметри, изчислени с помощта на метода на най-малките квадрати. В MLR моделът на най-малките квадрати е прогнозна функция на свойствата на почвата след избор на обяснителни променливи. Необходимо е отговорът да се използва за установяване на линейна връзка с помощта на обяснителни променливи. PTE беше използван като променлива на отговора за установяване на линия ar връзка с обяснителните променливи. Уравнението MLR е
където y е променливата на отговора, \(a\) е пресечната точка, n е броят на предикторите, \({b}_{1}\) е частичната регресия на коефициентите, \({x}_{ i}\) представлява предиктор или обяснителна променлива и \({\varepsilon }_{i}\) представлява грешката в модела, известна също като остатък.
Смесени модели бяха получени чрез смесване на EBK с SVMR и MLR. Това се прави чрез извличане на прогнозирани стойности от EBK интерполация. Прогнозираните стойности, получени от интерполираните Ca, K и Mg, се получават чрез комбинаторен процес за получаване на нови променливи, като CaK, CaMg и KMg. След това елементите Ca, K и Mg се комбинират, за да се получи четвърта променлива, CaKMg. Като цяло, получените променливи са Ca, K, Mg, CaK, CaMg, KMg и CaKMg. Тези променливи станаха наши предиктори, помагайки да се предскажат концентрациите на никел в градски и крайградски почви. Алгоритъмът SVMR беше изпълнен върху предикторите, за да се получи смесен модел Емпирична Bayesian Kriging-Support Vector Machine (EBK_SVM). По подобен начин променливите също се прекарват през алгоритъма MLR, за да се получи смесен модел Емпирична байесова кригинг-множествена линейна регресия (EBK_MLR). Обикновено променливите Ca, K, Mg, CaK, CaMg, KMg и CaKMg се използват като ковариати като предиктори на съдържанието на Ni в градски и крайградски почви. Най-приемливият получен модел (EBK_SVM или EBK_MLR) след това ще бъде визуализиран с помощта на самоорганизираща се графика. Работният процес на това изследване е показано на фигура 2.
Използването на SeOM се превърна в популярен инструмент за организиране, оценка и прогнозиране на данни във финансовия сектор, здравеопазването, промишлеността, статистиката, почвознанието и др. SeOM се създава с помощта на изкуствени невронни мрежи и неконтролирани методи за обучение за организация, оценка и прогнозиране. В това проучване SeOM беше използван за визуализиране на концентрациите на Ni въз основа на най-добрия модел за прогнозиране на Ni в градски и крайградски почви. Данните, обработени в оценката на SeOM, се използват като n входни данни -дименсионални векторни променливи43,56.Melssen et al.57 описват връзката на входен вектор в невронна мрежа чрез един входен слой към изходен вектор с един тегловен вектор. Изходът, генериран от SeOM, е двуизмерна карта, състояща се от различни неврони или възли, вплетени в шестоъгълни, кръгли или квадратни топологични карти според тяхната близост. Сравнявайки размерите на картата на базата на метрика, грешка при квантуване (QE) и топографска грешка (TE), моделът SeOM с Избира се съответно 0,086 и 0,904, което е единица от 55 карти (5 × 11). Структурата на неврона се определя според броя на възлите в емпиричното уравнение
Броят на данните, използвани в това проучване, е 115 проби. Беше използван случаен подход за разделяне на данните на тестови данни (25% за валидиране) и набори от данни за обучение (75% за калибриране). Наборът от данни за обучение се използва за генериране на регресионния модел (калибриране), а наборът от тестови данни се използва за проверка на способността за обобщение58. Това беше направено, за да се оцени пригодността на различни модели за прогнозиране на съдържанието на никел в почвите. Всички използвани модели премина през десетократен процес на кръстосано валидиране, повторен пет пъти. Променливите, произведени от EBK интерполация, се използват като предиктори или обяснителни променливи за прогнозиране на целевата променлива (PTE). Моделирането се обработва в RStudio с помощта на пакетите библиотека (Kohonen), библиотека (caret), библиотека (modelr), библиотека (“e1071″), библиотека (“plyr”), библиотека (“caTools”), библиотека(” prospectr” ) и библиотеки („Метрики“).
Бяха използвани различни параметри за валидиране, за да се определи най-добрият модел, подходящ за прогнозиране на концентрациите на никел в почвата и да се оцени точността на модела и неговото валидиране. Моделите на хибридизация бяха оценени с помощта на средна абсолютна грешка (MAE), средна квадратична грешка (RMSE) и R-квадрат или определяне на коефициента (R2). R2 определя дисперсията на пропорциите в отговора, представен от регресионния модел. RMSE и големината на дисперсията в независими мерки описва предсказващата сила на модела, докато MAE определя действителната количествена стойност. Стойността на R2 трябва да е висока, за да се оцени най-добрият модел на сместа, като се използват параметрите за валидиране, колкото по-близка е стойността до 1, толкова по-висока е точността. Според Li et al.59, стойност на критерий R2 от 0,75 или по-голяма се счита за добър предиктор;от 0,5 до 0,75 е приемлива производителност на модела, а под 0,5 е неприемлива производителност на модела. Когато избирате модел, използвайки методите за оценка на критериите за валидиране RMSE и MAE, получените по-ниски стойности са достатъчни и се считат за най-добрият избор. Следното уравнение описва метода за проверка.
където n представлява размера на наблюдаваната стойност\({Y}_{i}\) представлява измерения отговор, а \({\widehat{Y}}_{i}\) също представлява прогнозираната стойност на отговора, следователно, за първите i наблюдения.
Статистическите описания на предикторите и променливите на отговора са представени в таблица 1, показваща средна стойност, стандартно отклонение (SD), коефициент на вариация (CV), минимум, максимум, ексцес и изкривяване. Минималните и максималните стойности на елементите са в низходящ ред на Mg < Ca < K < Ni и Ca < Mg < K < Ni, съответно. 42,39 mg/kg. Сравнението на Ni със средното за света (29 mg/kg) и средното за Европа (37 mg/kg) показа, че общата изчислена средна геометрична стойност за района на изследване е в рамките на допустимия диапазон. Независимо от това, както е показано от Kabata-Pendias11, сравнение на средната концентрация на никел (Ni) в настоящото изследване със земеделски почви в Швеция показва, че текущата средна концентрация на никел е по-висока. По същия начин, средната концентрация на Frydek Mistek в градски и крайградски почви в настоящото проучване (Ni 16,15 mg/kg) е по-висок от допустимата граница от 60 (10,2 mg/kg) за Ni в полски градски почви, докладвани от Różański et al. Освен това, Bretzel и Calderisi61 регистрират много ниски средни концентрации на Ni (1,78 mg/kg) в градските почви в Тоскана в сравнение с настоящото проучване. Jim62 също установиха по-ниска концентрация на никел (12,34 mg/kg) в градските почви на Хонконг, което е по-ниско от текущата концентрация на никел в това проучване. Birke et al63 съобщават за средна концентрация на Ni от 17,6 mg/kg в стара минна и градска промишлена зона в Саксония-Анхалт, Германия, което е с 1,45 mg/kg по-високо от средната концентрация на Ni в района (16,15 mg/kg). Текущи изследвания. Прекомерното съдържание на никел в почвите в някои градски и крайградски райони на изследваната зона може да се дължи главно на производството на желязо и стомана и металната промишленост. Това е в съответствие с проучването на Khodadoust et al.64, че стоманодобивната промишленост и металообработването са основните източници на замърсяване с никел в почвите. Въпреки това предикторите също варират от 538,70 mg/kg до 69 161,80 mg/kg за Ca, 497,51 mg/kg до 3535,68 mg/kg за K и 685,68 mg/kg до 5970,05 mg/kg за Mg.Jakovljevic et. ал.65 изследват общото съдържание на Mg и K в почвите в централна Сърбия. Те откриха, че общите концентрации (съответно 410 mg/kg и 400 mg/kg) са по-ниски от концентрациите на Mg и K в настоящото изследване. Неразличимо е, че в източна Полша Orzechowski и Smolczynski66 оценяват общото съдържание на Ca, Mg и K и показват средни концентрации на Ca (1100 mg/kg), Mg (59 0 mg/kg) и K (810 mg/kg) Съдържанието в горния почвен слой е по-ниско от това на единичния елемент в това проучване. Скорошно проучване на Pongrac et al.67 показа, че общото съдържание на Ca, анализирано в 3 различни почви в Шотландия, Обединеното кралство (почва на Mylnefield, почва Balruddery и почва Hartwood), показва по-високо съдържание на Ca в това изследване.
Поради различните измерени концентрации на взетите в извадката елементи, разпределенията на набора от данни на елементите показват различна асимметрия. Асимметрията и ексцесът на елементите варират съответно от 1,53 до 7,24 и 2,49 до 54,16. Всички изчислени елементи имат нива на асиметрия и ексцес над +1, което показва, че разпределението на данните е неравномерно, изкривено в правилната посока и пиково. Изчислените CV на елементите показват също, че K, Mg и Ni проявяват умерена променливост, докато Ca има изключително висока променливост. CV на K, Ni и Mg обясняват равномерното им разпределение. Освен това разпределението на Ca е неравномерно и външни източници могат да повлияят на нивото на обогатяване.
Корелацията на предикторните променливи с елементите на отговора показва задоволителна корелация между елементите (виж Фигура 3). Корелацията показва, че CaK показва умерена корелация с r стойност = 0,53, както и CaNi. Въпреки че Ca и K показват скромни асоциации помежду си, изследователи като Kingston et al.68 и Santo69 предполагат, че техните нива в почвата са обратно пропорционални. Въпреки това Ca и Mg са антагонистични на K, но CaK корелира добре. Това може да се дължи на прилагането на торове като калиев карбонат, който е с 56% по-висок на калий. Калият е умерено свързан с магнезия (KM r = 0,63). В производството на торове тези два елемента са тясно свързани, тъй като калиев магнезиев сулфат, калиево магнезиев нитрат и поташ се прилагат към почвите, за да се увеличат нивата им на дефицит. Никелът е умерено свързан с Ca, K и Mg с r стойности = 0,52, 0,63 и 0,55, съответно. Връзките, включващи калций, магнезий и PTEs като никел, са сложни, но въпреки това магнезият инхибира калция ab сорбция, калцият намалява ефектите от излишния магнезий, а магнезият и калцият намаляват токсичните ефекти на никела в почвата.
Корелационна матрица за елементи, показваща връзката между предикторите и отговорите (Забележка: тази фигура включва диаграма на разсейване между елементите, нивата на значимост се основават на p < 0,001).
Фигура 4 илюстрира пространственото разпределение на елементите. Според Burgos et al70 прилагането на пространствено разпределение е техника, използвана за количествено определяне и подчертаване на горещи точки в замърсени райони. Нивата на обогатяване на Са на Фиг. 4 могат да се видят в северозападната част на картата на пространственото разпределение. Фигурата показва горещи точки с умерено до високо обогатяване на Са. Обогатяването на калций в северозападната част на картата вероятно се дължи на използването негасена вар (калциев оксид) за намаляване на киселинността на почвата и използването му в стоманодобивните мелници като алкален кислород в процеса на производство на стомана. От друга страна, други фермери предпочитат да използват калциев хидроксид в кисели почви, за да неутрализират рН, което също така повишава съдържанието на калций в почвата71. Калият също така показва горещи точки в северозападната и източната част на картата. Северозападът е основна селскостопанска общност, а средният до висок модел на калий може да се дължи на приложения на NPK и поташ. Това е в съответствие с други проучвания, като Madaras и Lipavský72, Madaras et al.73, Pulkrabová et al.74, Asare et al.75, които наблюдават, че стабилизирането на почвата и третирането с KCl и NPK води до високо съдържание на K в почвата.Пространствено Обогатяването на калий в северозападната част на картата на разпространение може да се дължи на използването на калиеви торове като калиев хлорид, калиев сулфат, калиев нитрат, поташ и поташ за увеличаване на съдържанието на калий в бедните почви. Zádorová et al.76 и Tlustoš et al.77 подчертава, че прилагането на калий-базирани торове повишава съдържанието на K в почвата и значително ще повиши съдържанието на хранителни вещества в почвата в дългосрочен план, особено K и Mg, показващи горещи точки в почвата. Относително умерени горещи точки в северозападната част на картата и югоизточната част на картата. Колоидната фиксация в почвата намалява концентрацията на магнезий в почвата. Липсата му в почвата кара растенията да проявяват жълт цвят ish intervein chlorosis. Базираните на магнезий торове, като калиев магнезиев сулфат, магнезиев сулфат и кизерит, третират недостатъци (растенията изглеждат лилави, червени или кафяви, което показва дефицит на магнезий) в почви с нормален диапазон на рН6. Натрупването на никел върху градски и крайградски почвени повърхности може да се дължи на антропогенни дейности като селското стопанство и значението на никела в производството на неръждаема стомана78.
Пространствено разпределение на елементи [картата на пространственото разпределение е създадена с помощта на ArcGIS Desktop (ESRI, Inc, версия 10.7, URL: https://desktop.arcgis.com).]
Резултатите от индекса на производителност на модела за елементите, използвани в това проучване, са показани в таблица 2. От друга страна, RMSE и MAE на Ni са близки до нула (0,86 RMSE, -0,08 MAE). От друга страна, както RMSE, така и MAE стойностите на K са приемливи. RMSE и MAE резултатите са по-високи за калций и магнезий. Ca и K MAE и RMSE резултатите са по-големи поради различни набори от данни. RMSE и MAE Установено е, че E от това проучване, използващо EBK за прогнозиране на Ni, е по-добро от резултатите на John et al.54 използвайки синергичен кригинг за прогнозиране на концентрациите на S в почвата, използвайки същите събрани данни. Резултатите от EBK, които изследвахме, корелират с тези на Fabijaczyk et al.41, Ян и др.79, Beguin et al.80, Adhikary et al.81 и John et al.82, особено K и Ni.
Ефективността на отделните методи за прогнозиране на съдържанието на никел в градски и крайградски почви беше оценена с помощта на ефективността на моделите (Таблица 3). Валидирането на модела и оценката на точността потвърдиха, че предикторът Ca_Mg_K, комбиниран с модела EBK SVMR, дава най-добра производителност. Моделът на калибриране Ca_Mg_K-EBK_SVMR модел R2, средната квадратична грешка (RMSE) и средната абсолютна грешка (MAE) бяха 0 0,637 (R2), 95,479 mg/kg (RMSE) и 77,368 mg/kg (MAE) Ca_Mg_K-SVMR беше 0,663 (R2), 235,974 mg/kg (RMSE) и 166,946 mg/kg (MAE). Независимо от това бяха получени добри стойности на R2 за Ca_Mg_K-SVMR (0,663 mg/kg R2) и Ca_Mg-EBK_SVMR (0.643 = R2);техните RMSE и MAE резултати са по-високи от тези за Ca_Mg_K-EBK_SVMR (R2 0,637) (вижте таблица 3). В допълнение, RMSE и MAE на модела Ca_Mg-EBK_SVMR (RMSE = 1664,64 и MAE = 1031,49) са съответно 17,5 и 13,4, които са по-големи от тези на Ca_Mg_K-EBK _SVMR. По същия начин RMSE и MAE на модела Ca_Mg-K SVMR (RMSE = 235,974 и MAE = 166,946) са 2,5 и 2,2 по-големи от тези на Ca_Mg_K-EBK_SVMR RMSE и MAE, съответно. Изчислените резултати от RMSE показват колко концентриран е наборът от данни с линията на най-добро съответствие. По-високи RSME и MAE бяха наблюдавани.Според Kebonye et al.46 и john et al.54, колкото по-близо до нула са RMSE и MAE, толкова по-добри са резултатите. SVMR и EBK_SVMR имат по-високи квантувани RSME и MAE стойности. Наблюдава се, че оценките на RSME са постоянно по-високи от стойностите на MAE, което показва наличието на извънредни стойности. Според Legates и McCabe83 степента, до която RMSE надвишава средната абсолютна грешка (MAE), се препоръчва като индикатор за наличието на извън Това означава, че колкото по-хетерогенен е наборът от данни, толкова по-високи са стойностите на MAE и RMSE. Точността на оценката за кръстосано валидиране на смесения модел Ca_Mg_K-EBK_SVMR за прогнозиране на съдържанието на Ni в градски и крайградски почви е 63,70%. Според Li et al.59, това ниво на точност е приемливо ниво на производителност на модела. Настоящите резултати са сравнени с предишно проучване на Tarasov et al.36, чийто хибриден модел създаде MLPRK (Multilayer Perceptron Residual Kriging), свързан с индекса за оценка на точността EBK_SVMR, отчетен в настоящото проучване, RMSE (210) и MAE (167,5) бяха по-високи от нашите резултати в настоящото проучване (RMSE 95,479, MAE 77,368). Въпреки това, когато сравняваме R2 от настоящото проучване (0,637) с това на Тарасов и др.36 (0,544), ясно е, че коефициентът на определяне (R2) е по-висок в този смесен модел. Маржът на грешка (RMSE и MAE) (EBK SVMR) за смесения модел е два пъти по-нисък. По същия начин Sergeev et al. 7 (R2). Нивото на точност на прогнозиране на този модел (EBK SVMR) е 63,7%, докато точността на прогнозиране, получена от Sergeev et al.34 е 28%. Окончателната карта (Фиг. 5), създадена с помощта на модела EBK_SVMR и Ca_Mg_K като предиктор, показва прогнози за горещи точки и умерен до никел в цялата изследвана област. Това означава, че концентрацията на никел в изследваната зона е предимно умерена, с по-високи концентрации в някои специфични области.
Окончателната прогнозна карта е представена с помощта на хибридния модел EBK_SVMR и използване на Ca_Mg_K като предиктор [Картата на пространственото разпределение е създадена с помощта на RStudio (версия 1.4.1717: https://www.rstudio.com/).]
Представени на фигура 6 са концентрациите на PTE като композиционна равнина, състояща се от отделни неврони. Нито една от равнините на компонентите не показва същия цветен модел, както е показано. Въпреки това, подходящият брой неврони на начертана карта е 55. SeOM се произвежда с помощта на различни цветове и колкото по-сходни са цветовите модели, толкова по-сравними са свойствата на пробите. Според тяхната точна цветова скала, отделните елементи (Ca, K и Mg) показват подобен цветен модел s до единични високи неврони и повечето ниски неврони. По този начин CaK и CaMg споделят някои прилики с неврони от много висок порядък и ниски до умерени цветови модели. И двата модела прогнозират концентрацията на Ni в почвата чрез показване на средни до високи нюанси на цветове като червено, оранжево и жълто. KMg моделът показва много високи цветови модели на базата на точни пропорции и ниски до средни цветни петна. В прецизна цветова скала от ниско към високо, равнинният модел на разпределение на компонентите на модела показаха висок цветен модел, показващ потенциалната концентрация на никел в почвата (вижте Фигура 4). Равнината на компонентите на модела CakMg показва разнообразен цветен модел от нисък до висок според точна цветова скала. Освен това прогнозата на модела за съдържанието на никел (CakMg) е подобна на пространственото разпределение на никел, показано на Фигура 5. И двете графики показват високи, средни и ниски пропорции на концентрации на никел в градски и периферни райони забранени почви. Фигура 7 изобразява контурния метод в групирането на k-средните на картата, разделен на три клъстера въз основа на прогнозираната стойност във всеки модел. Контурният метод представлява оптималния брой клъстери. От събраните 115 почвени проби, категория 1 получи най-много почвени проби, 74. Клъстер 2 получи 33 проби, докато клъстер 3 получи 8 проби. Комбинацията от седемкомпонентни планарни предиктори беше опростен, за да позволи правилна интерпретация на клъстери. Поради многобройните антропогенни и природни процеси, засягащи образуването на почвата, е трудно да има правилно диференцирани модели на клъстери в разпределена SeOM карта78.
Извеждане на равнина на компонент от всяка променлива на емпирична Bayesian Kriging Support Vector Machine (EBK_SVM_SeOM) [SeOM картите са създадени с помощта на RStudio (версия 1.4.1717: https://www.rstudio.com/).]
Различни компоненти за класификация на клъстери [SeOM картите са създадени с помощта на RStudio (версия 1.4.1717: https://www.rstudio.com/).]
Настоящото проучване ясно илюстрира техники за моделиране на концентрациите на никел в градски и крайградски почви. Проучването тества различни техники за моделиране, комбинирайки елементи с техники за моделиране, за да се получи най-добрият начин за прогнозиране на концентрациите на никел в почвата. Композиционните равнинни пространствени характеристики на SeOM на техниката за моделиране показват силен цветен модел от ниско до високо на точна цветова скала, показваща концентрациите на Ni в почвата. Въпреки това, картата на пространственото разпределение потвърждава равнинното пространствено разпределение на компонентите, показани от EBK_SVMR (вижте Фигура 5). Резултатите показват, че машинният регресионен модел на опорния вектор (Ca Mg K-SVMR) прогнозира концентрацията на Ni в почвата като единичен модел, но параметрите за валидиране и оценка на точността показват много големи грешки по отношение на RMSE и MAE. От друга страна, техниката на моделиране, използвана с модела EBK_MLR, също е погрешна поради ниската стойност на коефициента на детерминация (R2). Добри резултати бяха получени при използване на EBK SVMR и комбинирани елементи (CaKMg) с ниски RMSE и MAE грешки с точност от 63,7%. Оказва се, че комбинирането на EBK алгоритъма с алгоритъм за машинно обучение може да генерира хибриден алгоритъм, който може да предвиди концентрацията на PTEs в почвата. Резултатите показват, че използването на Ca Mg K като предиктори за прогнозиране на Ni концентрациите в изследваната зона могат да подобрят прогнозата за Ni в почвите. Това означава, че непрекъснатото прилагане на никелови торове и промишленото замърсяване на почвата от стоманодобивната промишленост има тенденция да повишава концентрацията на никел в почвата. Това проучване разкрива, че моделът EBK може да намали нивото на грешка и да подобри точността на модела на пространственото разпределение на почвата в градски или крайградски почви. Като цяло предлагаме да се приложи моделът EBK-SVMR за оценка и прогнозиране на PTE в почвата;в допълнение предлагаме да използваме EBK за хибридизиране с различни алгоритми за машинно обучение. Концентрациите на Ni бяха предсказани с помощта на елементи като ковариати;използването на повече ковариати обаче значително би подобрило производителността на модела, което може да се счита за ограничение на текущата работа. Друго ограничение на това проучване е, че броят на наборите от данни е 115. Следователно, ако се предоставят повече данни, производителността на предложения оптимизиран метод на хибридизация може да бъде подобрена.
PlantProbs.net. Никел в растенията и почвата https://plantprobs.net/plant/nutrientImbalances/sodium.html (Достъп до 28 април 2021 г.).
Kasprzak, KS Nickel напредък в съвременната екологична токсикология.surroundings.toxicology.11, 145–183 (1987).
Cempel, M. & Nikel, G. Nickel: Преглед на неговите източници и токсикологията на околната среда. Полски J. Environment.Stud.15, 375–382 (2006).
Freedman, B. & Hutchinson, TC Внасяне на замърсители от атмосферата и натрупване в почвата и растителността близо до никел-медна топилна фабрика в Съдбъри, Онтарио, Канада.can.J.Bot.58(1), 108-132.https://doi.org/10.1139/b80-014 (1980).
Manyiwa, T. et al. Тежки метали в почвата, растенията и рисковете, свързани с паша на преживни животни в близост до медно-никелова мина Selebi-Phikwe в Ботсвана. surroundings.Geochemistry.Health https://doi.org/10.1007/s10653-021-00918-x (2021).
Cabata-Pendias.Kabata-Pendias A. 2011. Микроелементи в почвата и… – Google Scholar https://scholar.google.com/scholar?hl=en&as_sdt=0%2C5&q=Kabata-Pendias+A.+2011.+Trace+ Elements+in+soils+and+plants.+4th+ed.+New+York+%28NY%29 %3A+CRC+Press&btnG= (Достъп до 24 ноември 2020 г.).
Almås, A., Singh, B., Земеделие, TS-NJ от & 1995, undefined. Ефекти на руската никелова промишленост върху концентрациите на тежки метали в земеделски почви и треви в Soer-Varanger, Norway.agris.fao.org.
Nielsen, GD et al. Абсорбцията и задържането на никел в питейната вода са свързани с приема на храна и чувствителността към никел.toxicology.application.Pharmacodynamics.154, 67–75 (1999).
Costa, M. & Klein, CB Никелова карциногенеза, мутация, епигенетика или селекция.обкръжение.Здравна гледна точка.107, 2 (1999).
Аджман, PC;Ахадо, SK;Борувка, Л.;Бини, JKM;Саркоди, ВЙО;Cobonye, ​​​​NM;Анализ на тенденциите на потенциално токсични елементи: библиометричен преглед. Геохимия на околната среда и здраве. Springer Science & Business Media BV 2020. https://doi.org/10.1007/s10653-020-00742-9.
Minasny, B. & McBratney, AB Цифрово картографиране на почвата: Кратка история и някои уроци. Geoderma 264, 301–311. https://doi.org/10.1016/j.geoderma.2015.07.017 (2016).
McBratney, AB, Mendonça Santos, ML & Minasny, B. Относно дигиталното картографиране на почвата. Geoderma 117(1-2), 3-52.https://doi.org/10.1016/S0016-7061(03)00223-4 (2003).
Deutsch.CV Geostatistical Reservoir Modeling,… – Google Scholar https://scholar.google.com/scholar?hl=en&as_sdt=0%2C5&q=CV+Deutsch%2C+2002%2C+Geostatistical+Reservoir+Modeling%2C +Oxford+University+Press%2C+376+pages.+&btnG= (Ac прекратен на 28 април 2021 г.).


Време на публикуване: 22 юли 2022 г