Прогноз концентрації нікелю в приміських і міських ґрунтах за допомогою змішаного емпіричного байєсівського крігінгу та опорної векторної машинної регресії

Дякуємо за відвідування Nature.com. Версія веб-переглядача, яку ви використовуєте, має обмежену підтримку CSS. Для найкращого досвіду ми рекомендуємо вам використовувати оновлений браузер (або вимкнути режим сумісності в Internet Explorer). Тим часом, щоб забезпечити постійну підтримку, ми відображатимемо сайт без стилів і JavaScript.
Забруднення ґрунту є великою проблемою, спричиненою діяльністю людини. Просторовий розподіл потенційно токсичних елементів (PTE) змінюється в більшості міських і приміських районів. Тому важко просторово передбачити вміст PTE у таких ґрунтах. Загалом 115 зразків було отримано від Frydek Mistek у Чеській Республіці. Концентрації кальцію (Ca), магнію (Mg), калію (K) і нікелю (Ni) визначали за допомогою емісійна спектрометрія з індуктивно зв’язаною плазмою. Змінна відповіді – Ni, а предиктори – Ca, Mg і K. Кореляційна матриця між змінною відповіді та змінною предиктора показує задовільну кореляцію між елементами. Результати прогнозу показали, що машинна регресія опорного вектора (SVMR) показала хороші результати, хоча її оціночна середньоквадратична помилка (RMSE) (235,974 мг/кг) і середня абсолютна помилка (MA) E) (166,946 мг/кг) були вищими, ніж інші застосовані методи. Змішані моделі для емпіричної байєсівської крігінг-множинної лінійної регресії (EBK-MLR) працюють погано, про що свідчать коефіцієнти детермінації менше 0,1. Емпірична байєсівська модель крігінг-підтримкової векторної машинної регресії (EBK-SVMR) була найкращою моделлю з низьким RMSE (95,479 мг/кг). кг) і значення MAE (77,368 мг/кг) і високий коефіцієнт детермінації (R2 = 0,637). Результати методу моделювання EBK-SVMR візуалізуються за допомогою карти самоорганізації. Кластерні нейрони в площині компонента гібридної моделі CakMg-EBK-SVMR демонструють кілька кольорових моделей, які передбачають концентрацію Ni в міських і приміських ґрунтах. Результати демонструють, що поєднання EBK і SVMR є ефективним методом для прогнозування концентрації Ni у міських та приміських ґрунтах.
Нікель (Ni) вважається мікроелементом для рослин, оскільки він сприяє фіксації атмосферного азоту (N) і метаболізму сечовини, які необхідні для проростання насіння. Окрім свого внеску в проростання насіння, Ni може діяти як грибковий і бактеріальний інгібітор і сприяти розвитку рослин. Нестача нікелю в ґрунті дозволяє рослині поглинати його, що призводить до хлорозу листя. Наприклад, коров’ячий горох і зелена квасоля потребують внесення. добрив на основі нікелю для оптимізації фіксації азоту2. Постійне внесення добрив на основі нікелю для збагачення ґрунту та підвищення здатності бобових фіксувати азот у ґрунті постійно збільшує концентрацію нікелю в ґрунті. Хоча нікель є мікроелементом для рослин, його надмірне надходження в ґрунт може принести більше шкоди, ніж користі. Токсичність нікелю в ґрунті мінімальна підвищує рН ґрунту та перешкоджає поглинанню заліза як важливої ​​поживної речовини для росту рослин1. Відповідно до Liu3, було встановлено, що Ni є 17-м важливим елементом, необхідним для розвитку та росту рослин. Окрім ролі нікелю в розвитку та зростанні рослин, люди потребують його для різноманітних застосувань. Гальваніка, виробництво сплавів на основі нікелю, а також виробництво пристроїв запалювання та свічок запалювання в автомобільній промисловості потребують використання нікелю в різних галузях промисловості. Крім того, сплави на основі нікелю та вироби з гальванічним покриттям широко використовуються в кухонному посуді, аксесуарах для бальних залів, товарах для харчової промисловості, електрообладнанні, дроті та кабелі, реактивних турбінах, хірургічних імплантатах, текстилі та суднобудуванні5. Рівень багатих нікелем у ґрунтах (тобто поверхневих ґрунтах) пояснюється як антропогенними, так і природними джерелами, але перш за все Ni є природним джерелом, а не антропогенним. pogenic4,6. Природні джерела нікелю включають виверження вулканів, рослинність, лісові пожежі та геологічні процеси;однак антропогенні джерела включають нікелеві/кадмієві батареї в металургійній промисловості, гальванічне покриття, дугове зварювання, дизельне паливо та мазут, а також викиди в атмосферу від спалювання вугілля та спалювання відходів і осаду.10, основними джерелами забруднення верхнього шару ґрунту в найближчому та прилеглому оточенні є в основному мідно-нікелеві заводи та шахти. Верхній ґрунт навколо нікелево-мідного нафтопереробного заводу в Садбері в Канаді мав найвищий рівень забруднення нікелем – 26 000 мг/кг11. Навпаки, забруднення від виробництва нікелю в Росії призвело до вищих концентрацій нікелю в норвезькому ґрунті11. ing до Алмса та ін.12, кількість нікелю, що екстрагується HNO3, на найкращих орних землях регіону (виробництво нікелю в Росії) коливалася від 6,25 до 136,88 мг/кг, що відповідає середньому 30,43 мг/кг і базовій концентрації 25 мг/кг. Відповідно до Kabata 11, застосування фосфорних добрив у сільськогосподарських ґрунтах у міських або приміських ґрунтах під час послідовних кр. Пори року можуть наповнювати або забруднювати ґрунт. Потенційний вплив нікелю на людей може призвести до раку через мутагенез, пошкодження хромосом, генерацію Z-ДНК, заблоковану репарацію видалення ДНК або епігенетичні процеси13. Під час експериментів на тваринах було виявлено, що нікель потенційно може викликати різноманітні пухлини, а канцерогенні комплекси нікелю можуть загострити такі пухлини.
Оцінки забруднення ґрунту останнім часом процвітають через широкий спектр проблем, пов’язаних зі здоров’ям, пов’язаних зі зв’язками ґрунт-рослина, ґрунтом і біологічними взаємозв’язками ґрунту, екологічною деградацією та оцінкою впливу на навколишнє середовище. На сьогоднішній день просторове прогнозування потенційно токсичних елементів (PTE), таких як Ni у ґрунті, було трудомістким і трудомістким за допомогою традиційних методів. Поява цифрового картографування ґрунту (DSM) і його поточний успіх15 мають великий успіх15. За словами Мінасні та МакБратні16, прогнозне картування ґрунтів (DSM) виявилося визначною субдисципліною ґрунтознавства. Lagacherie та McBratney, 2006 визначають DSM як «створення та наповнення просторових ґрунтових інформаційних систем шляхом використання методів спостереження in situ та лабораторних методів, а також просторових і непросторових висновків щодо ґрунту. системи».McBratney та ін.17 підкреслюють, що сучасна DSM або PSM є найефективнішою технікою для прогнозування або картографування просторового розподілу PTE, типів ґрунтів і властивостей ґрунтів. Геостатистика та алгоритми машинного навчання (MLA) — це методи моделювання DSM, які створюють оцифровані карти за допомогою комп’ютерів, використовуючи значні та мінімальні дані.
Deutsch18 і Olea19 визначають геостатистику як «набір чисельних методів, які мають справу з представленням просторових атрибутів, головним чином із застосуванням стохастичних моделей, наприклад, як аналіз часових рядів характеризує часові дані».В першу чергу геостатистика передбачає оцінку варіограм, які дозволяють кількісно визначити та визначити залежності просторових значень від кожного набору даних20.Gumiaux et al.20 додатково ілюструє, що оцінка варіограм у геостатистиці базується на трьох принципах, включаючи (a) обчислення масштабу кореляції даних, (b) ідентифікацію та обчислення анізотропії в розбіжності набору даних та (c) на додаток до врахування внутрішньої похибки даних вимірювань, відокремлених від локальних ефектів, також оцінюються ефекти площі. На основі цих концепцій у геостатистиці використовуються багато методів інтерполяції, включаючи загальний крігінг, ко-крігінг, звичайний крігінг, емпіричний байєсівський крігінг, простий метод крігінгу та інші добре відомі методи інтерполяції для картографування або прогнозування PTE, характеристик ґрунту та типів ґрунту.
Алгоритми машинного навчання (MLA) є відносно новою технікою, яка використовує більші нелінійні класи даних, що підживлюються алгоритмами, які в основному використовуються для інтелектуального аналізу даних, виявлення закономірностей у даних і неодноразово застосовуються для класифікації в таких наукових галузях, як ґрунтознавство та завдання повернення. Численні дослідницькі статті покладаються на моделі MLA для прогнозування PTE у ґрунтах, наприклад Tan et al.22 (випадкові ліси для оцінки важких металів у сільськогосподарських ґрунтах), Sakizadeh et al.23 (моделювання з використанням опорних векторних машин і штучних нейронних мереж) забруднення ґрунту). Крім того, Vega et al.24 (CART для моделювання утримання та адсорбції важких металів у ґрунті) Sun et al.25 (застосування кубізму — це розподіл Cd у ґрунті) та інші алгоритми, такі як k-найближчий сусід, узагальнена посилена регресія та посилена регресія дерев також застосовували MLA для прогнозування PTE у ґрунті.
Застосування алгоритмів DSM у прогнозуванні або картографуванні стикається з кількома проблемами. Багато авторів вважають, що MLA є кращим за геостатистику і навпаки. Хоча один кращий за інший, поєднання двох покращує рівень точності картографування чи прогнозування в DSM15. Вудкок і Гопал26 Фінке27;Понтіус, Чеук28 і Грюнвальд29 коментують недоліки та деякі помилки в прогнозованому картографуванні ґрунтів. Ґрунтознавці випробували різноманітні методи для оптимізації ефективності, точності та передбачуваності картографування та прогнозування DSM. Поєднання невизначеності та перевірки є одним із багатьох різних аспектів, інтегрованих у DSM для оптимізації ефективності та зменшення дефектів. Однак Agyeman et al.15 вказують на те, що поведінка перевірки та невизначеність, внесена створенням карти та прогнозуванням, повинні бути незалежно підтверджені для покращення якості карти. Обмеження DSM пов’язані з географічно розподіленою якістю ґрунту, яка включає компонент невизначеності;однак відсутність визначеності в DSM може виникати через численні джерела помилок, а саме помилки коваріатів, помилки моделі, помилки розташування та аналітичної помилки 31. Неточності моделювання, спричинені MLA та геостатистичними процесами, пов’язані з відсутністю розуміння, що в кінцевому підсумку призводить до надмірного спрощення реального процесу32. Незалежно від характеру моделювання, неточності можна віднести до параметрів моделювання, математики прогнозування за допомогою матичної моделі, або інтерполяція33. Нещодавно з’явилася нова тенденція DSM, яка сприяє інтеграції геостатистики та MLA у картографування та прогнозування. Декілька ґрунтознавців та авторів, таких як Sergeev et al.34;Субботіна та ін.35;Тарасов та ін.36 та Tarasov et al.37 використали точну якість геостатистики та машинного навчання для створення гібридних моделей, які покращують ефективність прогнозування та картографування.Деякі з цих гібридних або комбінованих моделей алгоритмів – штучний нейронний мережевий кригінг (ANN-RK), багатошаровий персептронний залишковий кригінг (MLP-RK), узагальнений регресійний нейронний мережевий залишковий кригінг (GR-NNRK)36, штучний нейронний мережевий кригінг-багатошаровий персептрон (ANN-K-MLP)37 та кокрігінг і регрес Гаусса іон38.
За словами Сергєєва та ін., поєднання різних методів моделювання має потенціал для усунення дефектів і підвищення ефективності отриманої гібридної моделі, а не для розробки єдиної моделі. У цьому контексті ця нова стаття стверджує, що необхідно застосувати комбінований алгоритм геостатистики та MLA для створення оптимальних гібридних моделей для прогнозування збагачення Ni в міських і приміських районах. Це дослідження буде спиратися на емпіричний байєсівський кригінг (EBK) як базову модель. і змішайте його з моделями опорної векторної машини (SVM) і множинної лінійної регресії (MLR). Гібридизація EBK з будь-якою MLA невідома. Кілька змішаних моделей, які спостерігаються, є комбінаціями звичайного, залишкового, регресійного крігінгу та MLA. над полем, враховуючи просторові варіації39. EBK використовувався в різноманітних дослідженнях, включаючи аналіз розподілу органічного вуглецю в ґрунтах ферм40, оцінку забруднення ґрунту41 та картографування властивостей ґрунту42.
З іншого боку, Self-Organizing Graph (SeOM) — це алгоритм навчання, який застосовувався в різних статтях, таких як Li et al.43, Ван та ін.44, Hossain Bhuiyan та ін.45 і Kebonye et al.46 Визначте просторові атрибути та групування елементів. Wang et al.44 підкреслюють, що SeOM є потужною технікою навчання, відомою своєю здатністю групувати та уявляти нелінійні проблеми. На відміну від інших методів розпізнавання образів, таких як аналіз головних компонентів, нечітка кластеризація, ієрархічна кластеризація та багатокритеріальне прийняття рішень, SeOM краще організовує та ідентифікує шаблони PTE. Згідно з Wang та ін.44, SeOM може просторово групувати розподіл пов’язаних нейронів і забезпечувати візуалізацію даних з високою роздільною здатністю. SeOM візуалізує дані прогнозу Ni, щоб отримати найкращу модель для характеристики результатів для прямої інтерпретації.
Ця стаття має на меті створити надійну модель картографування з оптимальною точністю для прогнозування вмісту нікелю в міських і приміських ґрунтах. Ми припускаємо, що надійність змішаної моделі в основному залежить від впливу інших моделей, доданих до базової моделі. Ми визнаємо проблеми, з якими стикається DSM, і хоча ці проблеми вирішуються на багатьох фронтах, поєднання прогресу в геостатистиці та моделях MLA, здається, є поступовим. ;тому ми спробуємо відповісти на запитання дослідження, які можуть дати змішані моделі. Проте, наскільки точною є модель для прогнозування цільового елемента? Крім того, який рівень оцінки ефективності на основі валідації та оцінки точності? Тому конкретними цілями цього дослідження було (а) створити комбіновану модель суміші для SVMR або MLR з використанням EBK як базової моделі, (б) порівняти отримані моделі (в) запропонувати найкращу модель суміші для прогнозування концентрацій Ni в містах або приміських ґрунтів, і (d) застосування SeOM для створення карти просторової варіації нікелю з високою роздільною здатністю.
Дослідження проводиться в Чеській Республіці, зокрема в районі Фрідек Містек у Моравсько-Сілезькому регіоні (див. рисунок 1). Географія досліджуваної території є дуже важкою і в основному є частиною регіону Моравсько-Сілезьких Бескидів, який є частиною зовнішнього краю Карпатських гір. Область дослідження розташована між 49° 41′ 0′ пн.ш. та 18° 20′ 0 ′ E, а висота між 225 і 327 м;однак система класифікації Коппена для кліматичного стану регіону оцінюється як Cfb = помірний океанічний клімат. Навіть у посушливі місяці випадає багато опадів. Протягом року температура дещо коливається від −5 °C до 24 °C, рідко опускаючись нижче −14 °C або вище 30 °C, тоді як середня річна кількість опадів становить від 685 до 752 мм47. Розрахункова площа дослідження всієї території становить 1208 квадратних кілометрів, з 39,38% обробленої землі та 49,36% лісового покриву. З іншого боку, територія, використана в цьому дослідженні, становить близько 889,8 квадратних кілометрів. В Остраві та навколо неї дуже активні сталеливарна промисловість і металургійні заводи. Металургійні комбінати, сталеливарна промисловість, де нікель використовується для виготовлення нержавіючої сталі (наприклад, для стійкості до атмосферної корозії) і легованої сталі (нікель збільшує міцність сплаву при збереженні його пластичності та в’язкості), а також інтенсивне сільське господарство, таке як внесення фосфорних добрив і тваринництво, є потенційними дослідницькими джерелами нікелю в регіоні (наприклад, додавання нікелю ягнятам для збільшення темпів росту ягнят і малої рогатої худоби). Інші промислові використання нікелю в дослідницьких областях включають його використання в гальваніці, включаючи гальванічний нікель і нікель. Властивості ґрунту легко відрізнити від кольору ґрунту, його структури та вмісту карбонатів. Текстура ґрунту від середньої до тонкої, отримана з материнського матеріалу. Вони колювіальні, алювіальні або еолові за своєю природою. Деякі ділянки ґрунту виглядають плямистими на поверхні та в підґрунті, часто з бетоном та вибілюванням. Проте камбісоли та стагнозолі є найпоширенішими типами ґрунтів у регіоні48. висота від 455,1 до 493,5 м, камбісоли домінують у Чехії49.
Карта досліджуваної території [Карту досліджуваної території створено за допомогою ArcGIS Desktop (ESRI, Inc, версія 10.7, URL: https://desktop.arcgis.com).]
Загалом було взято 115 зразків верхнього шару ґрунту з міських і приміських ґрунтів у районі Фрідек Містек. Використаний шаблон зразків являв собою звичайну сітку із зразками ґрунту, розташованими на відстані 2 × 2 км один від одного, і верхній шар ґрунту вимірювали на глибині від 0 до 20 см за допомогою ручного GPS-пристрою (Leica Zeno 5 GPS). Зразки упаковують у пакети Ziploc, належним чином маркують і відправляють до лабораторії. s були висушені на повітрі для отримання подрібнених зразків, подрібнених за допомогою механічної системи (дисковий млин Fritsch) і просіяних (розмір сита 2 мм). Помістіть 1 грам висушених, гомогенізованих і просіяних зразків ґрунту в чітко марковані тефлонові пляшки. У кожну тефлонову посудину влийте 7 мл 35% HCl і 3 мл 65% HNO3 (за допомогою автоматичного дозатора – по одному для кожної кислоти), накрийте кришкою. злегка та дайте зразкам постояти протягом ночі для реакції (програма «царська горілка»). Помістіть супернатант на гарячу металеву пластину (температура: 100 Вт і 160 °C) на 2 години, щоб полегшити процес перетравлення зразків, потім охолодіть. Перемістіть супернатант у мірну колбу на 50 мл і розведіть до 50 мл деіонізованою водою. Після цього відфільтруйте розведений супернатант у 5 0 мл ПВХ-пробірка з деіонізованою водою. Крім того, 1 мл розчину для розведення розбавляли 9 мл деіонізованої води та фільтрували в пробірку на 12 мл, підготовлену для псевдоконцентрації PTE. Концентрації PTE (As, Cd, Cr, Cu, Mn, Ni, Pb, Zn, Ca, Mg, K) визначали за допомогою ICP-OES (Inductively Coupled Plasma Optical Emission Spectro). scopy) (Thermo Fisher Scientific, США) відповідно до стандартних методів і угоди. Забезпечте процедури забезпечення та контролю якості (QA/QC) (SRM NIST 2711a Montana II Soil). PTE з межами виявлення нижче половини були виключені з цього дослідження. Межа виявлення PTE, використаного в цьому дослідженні, становила 0,0004.(ви). Крім того, контроль якості та процес забезпечення якості для кожного аналізу забезпечується анальним аналізом. Щоб переконатися, що помилки були мінімізовані, було виконано подвійний аналіз.
Емпіричний байєсівський крігінг (EBK) — це один із багатьох методів геостатистичного інтерполювання, який використовується в моделюванні в різних галузях, наприклад у ґрунтознавстві. На відміну від інших методів інтерполяції крігінгу, EBK відрізняється від традиційних методів крігінгу тим, що враховує похибку, оцінену моделлю варіограми. В інтерполяції EBK під час інтерполяції обчислюється кілька моделей напівваріограм, а не одна варіограма. Техніки інтерполяції дозволяють невизначеність і програмування, пов’язане з цим побудовою варіограми, яка є дуже складною частиною достатнього методу крігінгу. Процес інтерполяції EBK слідує трьом критеріям, запропонованим Krivoruchko50: (a) модель оцінює варіограму з вхідного набору даних (b) нове прогнозоване значення для кожного розташування вхідного набору даних на основі згенерованої напівваріограми та (c) остаточна модель A обчислюється з змодельованого набору даних. Правило рівняння Байєса подано як апостеріорне
Де \(Prob\left(A\right)\) представляє пріоритет, \(Prob\left(B\right)\) гранична ймовірність у більшості випадків ігнорується, \(Prob (B,A)\ ). Розрахунок напівваріограми базується на правилі Байєса, яке показує схильність наборів даних спостереження, які можна створити з напівваріограм. Значення напівваріограми потім визначається за допомогою правила Байєса, яке стверджує s наскільки ймовірно створити набір даних спостережень із напівваріограми.
Машина опорних векторів — це алгоритм машинного навчання, який генерує оптимальну роздільну гіперплощину для розрізнення ідентичних, але не лінійно незалежних класів. Vapnik51 створив алгоритм класифікації намірів, але нещодавно він використовується для вирішення проблем, орієнтованих на регресію. Відповідно до Лі та ін.52, SVM є одним із найкращих методів класифікації та використовується в різних областях. Компонент регресії SVM (Support Vector Machine Regression – SVMR) використовувався в цьому аналізі. Черкаський і Mulier53 вперше запровадили SVMR як регресію на основі ядра, обчислення якої виконувалося за допомогою моделі лінійної регресії з просторовими функціями багатьох країн. Джон та інші54 повідомляють, що моделювання SVMR використовує гіперплощинну лінійну регресію, яка створює нелінійні зв’язки та враховує просторові функції. Відповідно до Vohland та ін.55, epsilon (ε)-SVMR використовує навчений набір даних для отримання моделі представлення як епсилон-нечутливої ​​функції, яка застосовується для відображення даних незалежно з найкращим епсилон-зміщенням від навчання на корельованих даних. Попередньо встановлена ​​помилка відстані ігнорується з фактичного значення, і якщо помилка більша за ε(ε), властивості ґрунту компенсують її. Модель також зменшує складність навчальних даних до ширшої підмножини опорні вектори. Рівняння, запропоноване Vapnik51, показано нижче.
де b представляє скалярний поріг, \(K\left({x}_{,}{ x}_{k}\right)\) представляє ядерну функцію, \(\alpha\) представляє множник Лагранжа, N представляє числовий набір даних, \({x}_{k}\) представляє вхідні дані, а \(y\) є вихідними даними. Одним із ключових використовуваних ядер є операція SVMR, яка є радіалом Гауса базова функція (RBF). Ядро RBF застосовується для визначення оптимальної моделі SVMR, яка є критичною для отримання найтоншого коефіцієнта штрафного набору C і гамми параметра ядра (γ) для даних навчання PTE. Спочатку ми оцінили навчальний набір, а потім перевірили продуктивність моделі на наборі перевірки. Використаним керуючим параметром є sigma, а значенням методу є svmRadial.
Модель множинної лінійної регресії (MLR) — це регресійна модель, яка представляє зв’язок між змінною відповіді та низкою змінних предикторів за допомогою лінійних об’єднаних параметрів, обчислених за методом найменших квадратів. У MLR модель найменших квадратів є прогнозною функцією властивостей ґрунту після вибору пояснювальних змінних. Необхідно використовувати відповідь, щоб встановити лінійний зв’язок за допомогою пояснювальних змінних. PTE використовувався як змінна відповіді для встановлення лінії. ar співвідношення з пояснювальними змінними. Рівняння MLR є
де y — змінна відповіді, \(a\) — відрізок, n — кількість предикторів, \({b}_{1}\) — часткова регресія коефіцієнтів, \({x}_{ i}\) представляє предиктор або пояснювальну змінну, а \({\varepsilon }_{i}\) представляє помилку в моделі, також відому як залишкова.
Змішані моделі були отримані шляхом поєднання EBK з SVMR і MLR. Це робиться шляхом вилучення прогнозованих значень з інтерполяції EBK. Прогнозовані значення, отримані з інтерпольованих Ca, K і Mg, отримані за допомогою комбінаторного процесу для отримання нових змінних, таких як CaK, CaMg і KMg. Потім елементи Ca, K і Mg об’єднуються для отримання четвертої змінної, CaKMg. Загалом, отримані змінні Ca, K, Mg, CaK, CaMg, KMg і CaKMg. Ці змінні стали нашими предикторами, допомагаючи передбачити концентрацію нікелю в міських і приміських ґрунтах. Алгоритм SVMR був виконаний на предикторах для отримання змішаної моделі емпіричної байєсівської опорної векторної машини крігінгу (EBK_SVM). Подібним чином, змінні також передаються через алгоритм MLR для отримання змішана модель Байєсова множинна лінійна регресія (EBK_MLR). Як правило, змінні Ca, K, Mg, CaK, CaMg, KMg і CaKMg використовуються як коваріати як предиктори вмісту Ni в міських і приміських ґрунтах. Найбільш прийнятна отримана модель (EBK_SVM або EBK_MLR) буде візуалізована за допомогою самоорганізованого графіка. Робочий процес цього дослідження показано на малюнку 2.
Використання SeOM стало популярним інструментом для організації, оцінки та прогнозування даних у фінансовому секторі, охороні здоров’я, промисловості, статистиці, ґрунтознавстві тощо. SeOM створюється за допомогою штучних нейронних мереж і неконтрольованих методів навчання для організації, оцінки та прогнозування. У цьому дослідженні SeOM використовувався для візуалізації концентрацій Ni на основі найкращої моделі для прогнозування Ni в міських і приміських ґрунтах. Дані, оброблені в оцінці SeOM, використовуються як n вхідні дані. -вимірні векторні змінні43,56.Melssen et al.57 описують з’єднання вхідного вектора в нейронну мережу через один вхідний рівень до вихідного вектора з одним ваговим вектором. Вихідні дані, згенеровані SeOM, є двовимірною картою, що складається з різних нейронів або вузлів, сплетених у гексагональні, круглі або квадратні топологічні карти відповідно до їх близькості. Порівнюючи розміри карти на основі метрики, помилки квантування (QE) і топографічної помилки (TE), модель SeOM з Вибрано 0,086 і 0,904 відповідно, що є одиницею 55 карт (5 × 11). Структура нейрона визначається відповідно до кількості вузлів в емпіричному рівнянні
Кількість даних, використаних у цьому дослідженні, становить 115 зразків. Було використано випадковий підхід, щоб розділити дані на тестові дані (25% для перевірки) і навчальні набори даних (75% для калібрування). Навчальний набір даних використовується для створення регресійної моделі (калібрування), а тестовий набір даних використовується для перевірки здатності до узагальнення58. Це було зроблено для оцінки придатності різних моделей для прогнозування вмісту нікелю в ґрунтах. Усі моделі використовувалися. пройшов десятикратний процес перехресної перевірки, повторений п’ять разів. Змінні, створені інтерполяцією EBK, використовуються як предиктори або пояснювальні змінні для прогнозування цільової змінної (PTE). Моделювання обробляється в RStudio за допомогою бібліотеки пакетів (Kohonen), бібліотеки (caret), бібліотеки (modelr), бібліотеки (“e1071″), бібліотеки (“plyr”), бібліотеки (“caTools”), бібліотеки (“prospectr” ) і бібліотеки («Метрики»).
Для визначення найкращої моделі, придатної для прогнозування концентрації нікелю в ґрунті, а також для оцінки точності моделі та її перевірки використовувалися різні параметри перевірки. Моделі гібридизації оцінювали за допомогою середньої абсолютної помилки (MAE), середньої квадратичної помилки (RMSE) і R-квадрату або визначення коефіцієнта (R2). R2 визначає дисперсію пропорцій у відповіді, представлену регресійною моделлю. RMSE та Величина дисперсії в незалежних вимірюваннях описує прогностичну силу моделі, тоді як MAE визначає фактичне кількісне значення. Значення R2 має бути високим, щоб оцінити найкращу модель суміші за допомогою параметрів перевірки, чим ближче значення до 1, тим вища точність. Відповідно до Li et al.59, значення критерію R2 0,75 або більше вважається хорошим предиктором;від 0,5 до 0,75 є прийнятною продуктивністю моделі, а нижче 0,5 є неприйнятною продуктивністю моделі. При виборі моделі за допомогою методів оцінки критеріїв перевірки RMSE та MAE, нижчі отримані значення були достатніми та вважалися найкращим вибором. Наступне рівняння описує метод перевірки.
де n представляє розмір спостережуваного значення\({Y}_{i}\) представляє виміряну відповідь, а \({\widehat{Y}}_{i}\) також представляє прогнозоване значення відповіді, отже, для перших i спостережень.
Статистичні описи предикторів і змінних відповіді представлені в таблиці 1, де показано середнє значення, стандартне відхилення (SD), коефіцієнт варіації (CV), мінімум, максимум, ексцес і асиметрія. Мінімальні та максимальні значення елементів розташовані в порядку зменшення Mg < Ca < K < Ni і Ca < Mg < K < Ni відповідно. Концентрації змінної відповіді (Ni), відібраної з досліджуваної області, становили від 4,86 ​​до 42,39 мг/кг. Порівняння Ni із середніми значеннями у світі (29 мг/кг) і середніми значеннями в Європі (37 мг/кг) показало, що загальне розраховане середнє геометричне для досліджуваної території було в допустимому діапазоні. Тим не менш, як показано Кабата-Пендіасом11, порівняння середньої концентрації нікелю (Ni) у поточному дослідженні з сільськогосподарськими ґрунтами в Швеції показує, що поточна середня концентрація нікелю вища. Так само середня концентрація нікелю Frydek Mistek у міських і приміських ґрунтах у поточному дослідженні (Ni 16,15 мг/кг) був вищим за допустиму межу 60 (10,2 мг/кг) для Ni в польських міських ґрунтах, про яку повідомляють Różański та інші. Крім того, Бретцель і Кальдерізі61 зафіксували дуже низькі середні концентрації Ni (1,78 мг/кг) у міських ґрунтах Тоскани порівняно з поточним дослідженням. Jim62 також виявили нижчу концентрацію нікелю (12,34 мг/кг) у міських ґрунтах Гонконгу, що є нижчим за поточну концентрацію нікелю в цьому дослідженні. Бірке та інші63 повідомили про середню концентрацію нікелю 17,6 мг/кг у старій гірничій та міській промисловій зоні в Саксонії-Анхальт, Німеччина, що на 1,45 мг/кг вище, ніж середня концентрація нікелю в цьому районі (16,15 мг/кг). Поточні дослідження. Надмірний вміст нікелю у ґрунтах у деяких міських та приміських районах досліджуваної території можна в основному віднести до чорної металургії та металургійної промисловості. Це узгоджується з дослідженням Khodadoust et al.64, що сталеливарна промисловість і металообробка є основними джерелами забруднення нікелем у ґрунтах. Проте показники також коливалися від 538,70 мг/кг до 69 161,80 мг/кг для Ca, від 497,51 мг/кг до 3535,68 мг/кг для K і від 685,68 мг/кг до 5970,05 мг/кг для Mg.Jakovljevic et. al.65 досліджували загальний вміст Mg і K у ґрунтах у центральній Сербії. Вони виявили, що загальні концентрації (410 мг/кг і 400 мг/кг відповідно) були нижчими, ніж концентрації Mg і K у поточному дослідженні. У східній Польщі Orzechowski і Smolczynski66 оцінили загальний вміст Ca, Mg і K і показали середні концентрації Ca (1100 мг/кг), Mg (59). 0 мг/кг) і K (810 мг/кг). Вміст у верхньому шарі ґрунту нижчий, ніж вміст окремого елемента в цьому дослідженні. Недавнє дослідження Pongrac et al.67 показали, що загальний вміст Ca, проаналізований у 3 різних ґрунтах у Шотландії, Великобританія (ґрунт Mylnefield, ґрунт Balruddery та ґрунт Hartwood), свідчить про вищий вміст Ca у цьому дослідженні.
У зв’язку з різними виміряними концентраціями відібраних елементів, розподіли елементів набору даних демонструють різну асимметрию. Асимметрия та ексцес елементів коливаються від 1,53 до 7,24 та 2,49 до 54,16 відповідно. Усі обчислені елементи мають рівні асимметриї та ексцесу вище +1, таким чином вказуючи на те, що розподіл даних є нерегулярним, перекошеним у правильному напрямку та піковим. Розраховані CV елементів також показують, що K, Mg і Ni демонструють помірну мінливість, тоді як Ca має надзвичайно високу мінливість. CV K, Ni і Mg пояснюють їх рівномірний розподіл. Крім того, розподіл Ca є нерівномірним, і зовнішні джерела можуть впливати на рівень його збагачення.
Кореляція змінних предиктора з елементами відповіді вказує на задовільну кореляцію між елементами (див. Малюнок 3). Кореляція вказує на те, що CaK демонструє помірну кореляцію зі значенням r = 0,53, як і CaNi. Хоча Ca і K демонструють скромні асоціації один з одним, такі дослідники, як Kingston et al.68 і Santo69 припускають, що їхні рівні в ґрунті є обернено пропорційними. Однак Ca і Mg є антагоністами K, але CaK добре корелює. Це може бути пов’язано із застосуванням добрив, таких як карбонат калію, який містить на 56% більше калію. Калій помірно корелює з магнієм (KM r = 0,63). У промисловості добрив ці два елементи тісно пов’язані, оскільки сульфат калію-магнію, нітрат калію-магнію та поташ застосовуються до ґрунтів, щоб збільшити рівень їх дефіциту. Нікель помірно корелює з Ca, K та Mg зі значеннями r = 0,52, 0,63 та 0,55, відповідно. Взаємозв’язок між кальцієм, магнієм та PTE, такими як нікель, складний, але, тим не менш, магній пригнічує кальцій ab сорбції, кальцій зменшує дію надлишку магнію, а як магній, так і кальцій зменшують токсичну дію нікелю в ґрунті.
Кореляційна матриця для елементів, що показує зв’язок між предикторами та відповідями (Примітка: цей малюнок включає діаграму розсіювання між елементами, рівні значущості базуються на p < 0,001).
Рисунок 4 ілюструє просторовий розподіл елементів. Відповідно до Бургоса та інших70, застосування просторового розподілу є технікою, яка використовується для кількісного визначення та виділення гарячих точок у забруднених районах. Рівні збагачення кальцію на рис. 4 можна побачити в північно-західній частині карти просторового розподілу. На малюнку показано гарячі точки з помірним або високим вмістом кальцію. Збагачення кальцію на північному заході карти, ймовірно, пов’язане з використанням негашеного вапна (оксиду кальцію) для зменшення кислотності ґрунту та його використання на металургійних заводах як лужного кисню в процесі виробництва сталі. З іншого боку, інші фермери віддають перевагу використанню гідроксиду кальцію в кислих ґрунтах для нейтралізації рН, що також підвищує вміст кальцію в ґрунті71. Калій також показує гарячі точки на північному заході та сході карти. Північний захід є головним сільськогосподарським співтовариством, і модель від помірного до високого калію може бути пов’язано з застосуванням NPK і калію. Це узгоджується з іншими дослідженнями, такими як Madaras і Lipavský72, Madaras et al.73, Pulkrabová et al.74, Asare et al.75, які помітили, що стабілізація ґрунту та обробка KCl і NPK призвели до високого вмісту калію в ґрунті.Просторове збагачення калієм на північному заході карти розподілу може відбуватися завдяки використанню калійних добрив, таких як хлорид калію, сульфат калію, нітрат калію, поташ і поташ для підвищення вмісту калію в бідних ґрунтах. Zádorová et al.76 та Tlustoš et al.77 підкреслив, що застосування добрив на основі калію збільшило вміст калію в ґрунті та значно збільшило вміст поживних речовин у ґрунті в довгостроковій перспективі, особливо калію та магнію, які показують гарячі точки в ґрунті. Відносно помірні гарячі точки на північному заході карти та південному сході карти. Колоїдна фіксація в ґрунті зменшує концентрацію магнію в ґрунті. Його нестача в ґрунті спричиняє пожовтіння рослин. Добрива на основі магнію, такі як сульфат магнію, сульфат магнію та кізерит, усувають недоліки (рослини виглядають фіолетовими, червоними або коричневими, що вказує на дефіцит магнію) у ґрунтах із нормальним діапазоном рН6. Накопичення нікелю на міських та приміських поверхнях ґрунту може бути наслідком антропогенної діяльності, наприклад сільського господарства та важливості нікелю. у виробництві нержавіючої сталі78.
Просторовий розподіл елементів [карту просторового розподілу створено за допомогою ArcGIS Desktop (ESRI, Inc, версія 10.7, URL: https://desktop.arcgis.com).]
Результати індексу ефективності моделі для елементів, використаних у цьому дослідженні, наведено в таблиці 2. З іншого боку, RMSE і MAE для Ni близькі до нуля (0,86 RMSE, -0,08 MAE). З іншого боку, як RMSE, так і MAE значення K є прийнятними. Результати RMSE і MAE були вищими для кальцію і магнію. Результати MAE і RMSE для Ca і K більші через різні набори даних. RMSE і MAE були більшими для кальцію і магнію. E цього дослідження з використанням EBK для прогнозування Ni виявилися кращими, ніж результати John et al.54 за допомогою синергічного крігінгу для прогнозування концентрації серу в ґрунті, використовуючи ті самі зібрані дані. Результати EBK, які ми вивчали, корелюють з даними Fabijaczyk et al.41, Ян та ін.79, Beguin та ін.80, Adhikary та ін.81 та Джон та ін.82, особливо K і Ni.
Ефективність окремих методів для прогнозування вмісту нікелю в міських і приміських ґрунтах оцінювалася за допомогою моделей (табл. 3). Перевірка моделі та оцінка точності підтвердили, що предиктор Ca_Mg_K у поєднанні з моделлю EBK SVMR дає найкращу продуктивність. Калібрувальна модель Ca_Mg_K-EBK_SVMR, модель R2, середньоквадратична помилка (RMSE) і середня абсолютна помилка (MAE) були 0 0,637 (R2), 95,479 мг/кг (RMSE) і 77,368 мг/кг (MAE) Ca_Mg_K-SVMR становив 0,663 (R2), 235,974 мг/кг (RMSE) і 166,946 мг/кг (MAE). Тим не менш, хороші значення R2 були отримані для Ca_Mg_K-SVMR (0,663 мг/кг R2) і Ca_Mg-EBK_SVMR (0,643 = R2);їхні результати RMSE і MAE були вищими, ніж для Ca_Mg_K-EBK_SVMR (R2 0,637) (див. таблицю 3). Крім того, RMSE і MAE моделі Ca_Mg-EBK_SVMR (RMSE = 1664,64 і MAE = 1031,49) становлять 17,5 і 13,4 відповідно, що більше, ніж у Ca_Mg_K-EBK _SVMR. Подібним чином, RMSE і MAE моделі Ca_Mg-K SVMR (RMSE = 235,974 і MAE = 166,946) на 2,5 і 2,2 більші, ніж у Ca_Mg_K-EBK_SVMR RMSE і MAE, відповідно. Розраховані результати RMSE вказують на те, наскільки набір даних відповідає лінії найкращого збігу. Вищі RSME і MAE були Згідно з Kebonye et al.46 та john et al.54, чим ближче RMSE і MAE до нуля, тим кращі результати. SVMR і EBK_SVMR мають вищі квантовані значення RSME і MAE. Було помічено, що оцінки RSME були постійно вищими за значення MAE, що вказує на наявність викидів. Відповідно до Legates і McCabe83, ступінь, до якої RMSE перевищує середню абсолютну похибку (MAE), рекомендовано як індикатор наявності поза це означає, що чим гетерогенніший набір даних, тим вищі значення MAE і RMSE. Точність оцінки перехресної перевірки змішаної моделі Ca_Mg_K-EBK_SVMR для прогнозування вмісту Ni в міських і приміських ґрунтах становила 63,70%. Відповідно до Li et al.59, цей рівень точності є прийнятним показником ефективності моделі. Нинішні результати порівнюються з попереднім дослідженням Tarasov et al.36, чия гібридна модель створила MLPRK (багатошаровий персептронний залишковий крігінг), пов’язаний з індексом оцінки точності EBK_SVMR, наведеним у поточному дослідженні, RMSE (210) і MAE (167,5) були вищими, ніж наші результати в поточному дослідженні (RMSE 95,479, MAE 77,368). Однак, порівнюючи R2 поточного дослідження (0,637) з цим Тарасова та ін.36 (0,544), зрозуміло, що коефіцієнт детермінації (R2) вищий у цій змішаній моделі. Похибка (RMSE та MAE) (EBK SVMR) для змішаної моделі вдвічі нижча. Подібним чином Сергєєв та ін.34 зафіксували 0,28 (R2) для розробленої гібридної моделі (багатошаровий перцептронний залишковий кригінг), тоді як Ni у поточному дослідженні зафіксував 0,63 7 (R2). Рівень точності прогнозу цієї моделі (EBK SVMR) становить 63,7%, тоді як точність прогнозу, отримана Sergeev et al.34 становить 28%. Остаточна карта (рис. 5), створена з використанням моделі EBK_SVMR і Ca_Mg_K як предиктора, показує прогнози гарячих точок і від помірного до нікелю на всій досліджуваній території. Це означає, що концентрація нікелю в досліджуваній області в основному помірна, з вищими концентраціями в деяких конкретних областях.
Остаточна прогнозована карта представлена ​​за допомогою гібридної моделі EBK_SVMR із використанням Ca_Mg_K як предиктора [Карту просторового розподілу створено за допомогою RStudio (версія 1.4.1717: https://www.rstudio.com/).]
На малюнку 6 представлені концентрації PTE у вигляді композиційної площини, що складається з окремих нейронів. Жодна з площин компонентів не демонструвала такий самий колірний візерунок, як показано. Однак відповідна кількість нейронів на намальовану карту становить 55. SeOM виробляється з використанням різноманітних кольорів, і чим схожіші кольорові шаблони, тим порівнянніші властивості зразків. Відповідно до їхньої точної колірної шкали, окремі елементи (Ca, K і Mg) демонстрували подібний колірний візерунок. s до окремих високих нейронів і більшості низьких нейронів. Таким чином, CaK і CaMg мають певну схожість із нейронами дуже високого порядку та кольоровими візерунками від низького до помірного. Обидві моделі передбачають концентрацію Ni у ґрунті, відображаючи від середніх до високих відтінків кольорів, таких як червоний, помаранчевий і жовтий. Модель KMg відображає багато високих кольорових візерунків на основі точних пропорцій і кольорових плям від низького до середнього. Компоненти моделі показали високий колірний візерунок, що вказує на потенційну концентрацію нікелю в ґрунті (див. Малюнок 4). Площина компонентів моделі CakMg демонструє різноманітний колірний візерунок від низького до високого відповідно до точної колірної шкали. Крім того, передбачення моделі вмісту нікелю (CakMg) подібне до просторового розподілу нікелю, показаного на Малюнку 5. Обидва графіки показують високі, середні та низькі частки концентрації нікелю в містах і околицях. заборонені ґрунти. На малюнку 7 зображено метод контурів у групуванні k-середніх на карті, розділених на три кластери на основі прогнозованого значення в кожній моделі. Метод контурів представляє оптимальну кількість кластерів. Зі 115 зібраних зразків ґрунту категорія 1 отримала найбільше зразків ґрунту, 74. Кластер 2 отримав 33 зразки, тоді як кластер 3 отримав 8 зразків. Комбінація семикомпонентного планарного предиктора була спрощено, щоб забезпечити правильну інтерпретацію кластерів. Через численні антропогенні та природні процеси, що впливають на ґрунтоутворення, важко мати належним чином диференційовані моделі кластерів у розподіленій карті SeOM78.
Виведення площини компонентів кожною змінною емпіричної байєсівської векторної машини підтримки крігінга (EBK_SVM_SeOM). Карти SeOM створено за допомогою RStudio (версія 1.4.1717: https://www.rstudio.com/).]
Різні компоненти класифікації кластерів [Карти SeOM створено за допомогою RStudio (версія 1.4.1717: https://www.rstudio.com/).]
Поточне дослідження чітко ілюструє методи моделювання концентрації нікелю в міських і приміських ґрунтах. Дослідження протестувало різні методи моделювання, поєднуючи елементи з методами моделювання, щоб отримати найкращий спосіб прогнозування концентрації нікелю в ґрунті. Композиційні площинні просторові характеристики SeOM техніки моделювання показали високу кольорову схему від низького до високого на точній колірній шкалі, що вказує на концентрацію Ni у ґрунті. Однак карта просторового розподілу підтверджує планарний просторовий розподіл компонентів, представлений EBK_SVMR (див. Малюнок 5). Результати показують, що модель опорного вектора машинної регресії (Ca Mg K-SVMR) передбачає концентрацію Ni в ґрунті як єдину модель, але параметри перевірки та оцінки точності показують дуже високі похибки з точки зору RMSE та MAE. З іншого боку, техніка моделювання, яка використовується з моделлю EBK_MLR, також має недоліки через низьке значення коефіцієнта детермінації (R2). Хороші результати були отримані з використанням EBK SVMR і комбінованих елементів (CaKMg) з низькими помилками RMSE і MAE з точністю 63,7%. Виявилося, що поєднання алгоритму EBK з алгоритмом машинного навчання може створити гібридний алгоритм, який може передбачити концентрацію PTE в ґрунті. Результати показують, що використання Ca Mg K як предикторів для прогнозування Ni концентрації в досліджуваній зоні можуть покращити прогноз Ni у ґрунтах. Це означає, що безперервне застосування добрив на основі нікелю та промислове забруднення ґрунту металургійною промисловістю має тенденцію до збільшення концентрації нікелю в ґрунті. Це дослідження показало, що модель EBK може зменшити рівень помилок і підвищити точність моделі просторового розподілу ґрунту в міських або приміських ґрунтах. Загалом, ми пропонуємо застосувати модель EBK-SVMR оцінювати та прогнозувати ПТЕ в ґрунті;крім того, ми пропонуємо використовувати EBK для гібридизації з різними алгоритмами машинного навчання. Концентрації Ni були передбачені з використанням елементів як коваріантів;однак використання більшої кількості коваріат значно покращить продуктивність моделі, що можна вважати обмеженням поточної роботи. Ще одним обмеженням цього дослідження є те, що кількість наборів даних становить 115. Тому, якщо надати більше даних, продуктивність запропонованого оптимізованого методу гібридизації можна покращити.
PlantProbs.net. Нікель у рослинах і ґрунті https://plantprobs.net/plant/nutrientImbalances/sodium.html (перевірено 28 квітня 2021 р.).
Kasprzak, KS Nickel advances in modern environmental toxicology.surroundings.toxicology.11, 145–183 (1987).
Cempel, M. & Nikel, G. Nickel: Огляд його джерел і екологічної токсикології. Polish J. Environment.Stud.15, 375–382 (2006).
Freedman, B. & Hutchinson, TC Надходження забруднювачів з атмосфери та накопичення в ґрунті та рослинності поблизу нікелево-мідного заводу в Садбері, Онтаріо, Канада.can.J.Bot.58(1), 108-132.https://doi.org/10.1139/b80-014 (1980).
Manyiwa, T. et al. Важкі метали в ґрунті, рослинах та ризики, пов’язані з випасом жуйних поблизу мідно-нікелевої шахти Selebi-Phikwe у Ботсвані. surroundings.Geochemistry.Health https://doi.org/10.1007/s10653-021-00918-x (2021).
Cabata-Pendias.Kabata-Pendias A. 2011. Мікроелементи в ґрунті та… – Google Scholar https://scholar.google.com/scholar?hl=en&as_sdt=0%2C5&q=Kabata-Pendias+A.+2011.+Trace+ Elements+in+soils+and+plants.+4th+ed.+New+York+%28NY%29 %3A+CRC+Press&btnG= (переглянуто 24 листопада 2020 р.).
Almås, A., Singh, B., Agriculture, TS-NJ of & 1995, undefined. Вплив російської нікелевої промисловості на концентрацію важких металів у сільськогосподарських ґрунтах і травах у Soer-Varanger, Norway.agris.fao.org.
Nielsen, GD та ін. Поглинання та утримання нікелю в питній воді пов’язані з прийомом їжі та чутливістю до нікелю.toxicology.application.Pharmacodynamics.154, 67–75 (1999).
Коста, М. & Кляйн, К. Б. Нікелевий канцерогенез, мутація, епігенетика або селекційне середовище. Перспектива здоров'я. 107, 2 (1999).
Аджман, ПК;Ахадо, SK;Борівка Л.;Біні, JKM;Саркодій В.Й.О.;Кобоні, Н.М.;Аналіз тенденцій потенційно токсичних елементів: бібліометричний огляд. Environmental Geochemistry and Health. Springer Science & Business Media BV 2020. https://doi.org/10.1007/s10653-020-00742-9.
Minasny, B. & McBratney, AB Digital Soil Mapping: A Brief History and Some Lessons.Geoderma 264, 301–311.https://doi.org/10.1016/j.geoderma.2015.07.017 (2016).
McBratney, AB, Mendonça Santos, ML & Minasny, B. Про цифрове картографування ґрунтів. Geoderma 117(1-2), 3-52.https://doi.org/10.1016/S0016-7061(03)00223-4 (2003).
Deutsch.CV Geostatistical Reservoir Modeling,… – Google Scholar https://scholar.google.com/scholar?hl=uk&as_sdt=0%2C5&q=CV+Deutsch%2C+2002%2C+Geostatistical+Reservoir+Modeling%2C +Oxford+University+Press%2C+376+pages.+&btnG= (Ac припинено 28 квітня 2021 року).


Час публікації: 22 липня 2022 р