Prédiction des concentrations de nickel dans les sols suburbains et urbains à l'aide d'un krigeage bayésien empirique mixte et d'une régression par machine à vecteur de support

Merci d'avoir visité Nature.com.La version du navigateur que vous utilisez offre une prise en charge limitée de CSS.Pour une expérience optimale, nous vous recommandons d'utiliser un navigateur mis à jour (ou de désactiver le mode de compatibilité dans Internet Explorer).En attendant, pour assurer une prise en charge continue, nous afficherons le site sans styles ni JavaScript.
La pollution des sols est un gros problème causé par les activités humaines. La distribution spatiale des éléments potentiellement toxiques (PTE) varie dans la plupart des zones urbaines et périurbaines. Par conséquent, il est difficile de prédire spatialement la teneur en PTE dans ces sols. Au total, 115 échantillons ont été obtenus de Frydek Mistek en République tchèque. ous sont Ca, Mg et K. La matrice de corrélation entre la variable de réponse et la variable prédictive montre une corrélation satisfaisante entre les éléments. Les résultats de prédiction ont montré que la régression par machine à vecteur de support (SVMR) fonctionnait bien, bien que son erreur quadratique moyenne estimée (RMSE) (235,974 mg/kg) et son erreur absolue moyenne (MAE) (166,946 mg/kg) étaient plus élevées que les autres méthodes appliquées. R) fonctionnent mal, comme en témoignent des coefficients de détermination inférieurs à 0,1. Le modèle EBK-SVMR (Empirical Bayesian Kriging-Support Vector Machine Regression) était le meilleur modèle, avec des valeurs faibles de RMSE (95,479 mg/kg) et de MAE (77,368 mg/kg) et un coefficient de détermination élevé (R2 = 0,637). les neurones dans le plan du composant du modèle hybride CakMg-EBK-SVMR montrent plusieurs motifs de couleur qui prédisent les concentrations de Ni dans les sols urbains et périurbains. Les résultats démontrent que la combinaison EBK et SVMR est une technique efficace pour prédire les concentrations de Ni dans les sols urbains et périurbains.
Le nickel (Ni) est considéré comme un micronutriment pour les plantes car il contribue à la fixation de l'azote atmosphérique (N) et au métabolisme de l'urée, tous deux nécessaires à la germination des graines. En plus de sa contribution à la germination des graines, le nickel peut agir comme un inhibiteur fongique et bactérien et favoriser le développement des plantes. s pour enrichir le sol et augmenter la capacité des légumineuses à fixer l'azote dans le sol augmente continuellement la concentration de nickel dans le sol. Bien que le nickel soit un micronutriment pour les plantes, son apport excessif dans le sol peut faire plus de mal que de bien. La galvanoplastie, la production d'alliages à base de nickel et la fabrication de dispositifs d'allumage et de bougies d'allumage dans l'industrie automobile nécessitent toutes l'utilisation de nickel dans divers secteurs industriels. une source naturelle plutôt qu'anthropique4,6. Les sources naturelles de nickel comprennent les éruptions volcaniques, la végétation, les incendies de forêt et les processus géologiques ;cependant, les sources anthropiques comprennent les batteries au nickel/cadmium dans l'industrie sidérurgique, la galvanoplastie, le soudage à l'arc, le diesel et les mazouts, et les émissions atmosphériques provenant de la combustion du charbon et de l'incinération des déchets et des boues Accumulation de nickel7,8. Selon Freedman et Hutchinson9 et Manyiwa et al.10, les principales sources de pollution de la couche arable dans l'environnement immédiat et adjacent sont principalement les fonderies et les mines de nickel-cuivre. La couche arable autour de la raffinerie de nickel-cuivre de Sudbury au Canada présentait les niveaux les plus élevés de contamination par le nickel à 26 000 mg/kg11. En revanche, la pollution due à la production de nickel en Russie a entraîné des concentrations de nickel plus élevées dans le sol norvégien11. Selon Alms et al.12, la quantité de nickel extractible au HNO3 dans les meilleures terres arables de la région (production de nickel en Russie) variait de 6,25 à 136,88 mg/kg, correspondant à une moyenne de 30,43 mg/kg et une concentration de base de 25 mg/kg. .Les effets potentiels du nickel chez l'homme peuvent entraîner le cancer par mutagenèse, dommages chromosomiques, génération d'ADN-Z, réparation par excision d'ADN bloquée ou processus épigénétiques13.Dans des expériences sur des animaux, il a été découvert que le nickel avait le potentiel de provoquer diverses tumeurs, et des complexes de nickel cancérigènes peuvent exacerber ces tumeurs.
Les évaluations de la contamination des sols ont prospéré ces derniers temps en raison d'un large éventail de problèmes de santé liés aux relations sol-plante, aux relations biologiques entre le sol et le sol, à la dégradation écologique et à l'évaluation de l'impact environnemental. s'est avéré être une sous-discipline de premier plan de la science du sol. Lagacherie et McBratney, 2006 définissent le DSM comme "la création et le remplissage de systèmes d'information spatiale sur les sols grâce à l'utilisation de méthodes d'observation in situ et en laboratoire et de systèmes d'inférence de sol spatiaux et non spatiaux".McBratney et al.17 soulignent que le DSM ou PSM contemporain est la technique la plus efficace pour prédire ou cartographier la distribution spatiale des PTE, des types de sol et des propriétés du sol. La géostatistique et les algorithmes d'apprentissage automatique (MLA) sont des techniques de modélisation DSM qui créent des cartes numérisées à l'aide d'ordinateurs utilisant des données significatives et minimales.
Deutsch18 et Olea19 définissent la géostatistique comme "l'ensemble des techniques numériques qui traitent de la représentation des attributs spatiaux, utilisant principalement des modèles stochastiques, tels que la manière dont l'analyse des séries chronologiques caractérise les données temporelles".Principalement, la géostatistique implique l'évaluation de variogrammes, qui permettent de quantifier et de définir les dépendances des valeurs spatiales de chaque jeu de données20.Gumiaux et al.20 illustrent en outre que l'évaluation des variogrammes en géostatistique repose sur trois principes, notamment (a) le calcul de l'échelle de corrélation des données, (b) l'identification et le calcul de l'anisotropie dans la disparité des ensembles de données et (c) en plus de En plus de prendre en compte l'erreur inhérente aux données de mesure séparées des effets locaux, les effets de surface sont également estimés. krigeage ésien, méthode de krigeage simple et autres techniques d'interpolation bien connues pour cartographier ou prédire le PTE, les caractéristiques du sol et les types de sol.
Les algorithmes d'apprentissage automatique (MLA) sont une technique relativement nouvelle qui utilise de plus grandes classes de données non linéaires, alimentées par des algorithmes principalement utilisés pour l'exploration de données, l'identification de modèles dans les données et appliquées à plusieurs reprises à la classification dans des domaines scientifiques tels que la science du sol et les tâches de retour. De nombreux articles de recherche s'appuient sur des modèles MLA pour prédire la PTE dans les sols, comme Tan et al.22 (forêts aléatoires pour l'estimation des métaux lourds dans les sols agricoles), Sakizadeh et al.23 (modélisation à l'aide de machines à vecteurs de support et de réseaux de neurones artificiels) pollution des sols). De plus, Vega et al.24 (CART pour la modélisation de la rétention et de l'adsorption des métaux lourds dans le sol) Sun et al.25 (l'application de cubist est la distribution de Cd dans le sol) et d'autres algorithmes tels que le k-plus proche voisin, la régression amplifiée généralisée et les arbres de régression amplifiée ont également appliqué MLA pour prédire la PTE dans le sol.
L'application des algorithmes DSM dans la prédiction ou la cartographie fait face à plusieurs défis. De nombreux auteurs pensent que la MLA est supérieure à la géostatistique et vice versa. Bien que l'un soit meilleur que l'autre, la combinaison des deux améliore le niveau de précision de la cartographie ou de la prédiction dans le DSM15. Woodcock et Gopal26 Finke27 ;Pontius et Cheuk28 et Grunwald29 commentent les lacunes et certaines erreurs dans la cartographie prédite des sols. Les pédologues ont essayé diverses techniques pour optimiser l'efficacité, la précision et la prévisibilité de la cartographie et de la prévision DSM. La combinaison de l'incertitude et de la vérification est l'un des nombreux aspects différents intégrés dans DSM pour optimiser l'efficacité et réduire les défauts. Cependant, Agyeman et al.15 soulignent que le comportement de validation et l'incertitude introduits par la création et la prédiction de la carte doivent être validés de manière indépendante pour améliorer la qualité de la carte. Les limites du DSM sont dues à la qualité du sol géographiquement dispersée, qui implique une composante d'incertitude ;Cependant, le manque de certitude dans le DSM peut provenir de multiples sources d'erreur, à savoir l'erreur de covariable, l'erreur de modèle, l'erreur de localisation et l'erreur analytique. qui favorise l'intégration de la géostatistique et de la MLA dans la cartographie et la prévision. Plusieurs pédologues et auteurs, tels que Sergeev et al.34 ;Subbotina et al.35;Tarassov et al.36 et Tarassov et al.37 ont exploité la qualité précise de la géostatistique et de l'apprentissage automatique pour générer des modèles hybrides qui améliorent l'efficacité des prévisions et de la cartographie.Certains de ces modèles d'algorithmes hybrides ou combinés sont le krigeage de réseau neuronal artificiel (ANN-RK), le krigeage résiduel de perception multicouche (MLP-RK), le krigeage résiduel de réseau neuronal de régression généralisée (GR-NNRK)36, le krigeage de réseau neuronal artificiel-perceptron multicouche (ANN-K-MLP)37 et le co-krigeage et la régression de processus gaussien38.
Selon Sergeev et al., combiner diverses techniques de modélisation a le potentiel d'éliminer les défauts et d'augmenter l'efficacité du modèle hybride résultant plutôt que de développer son modèle unique. L'hybridation d'EBK avec n'importe quel MLA n'est pas connue. et la cartographie des propriétés du sol42.
D'autre part, Self-Organizing Graph (SeOM) est un algorithme d'apprentissage qui a été appliqué dans divers articles tels que Li et al.43, Wang et al.44, Hossain Bhuiyan et al.45 et Kebonye et al.46 Déterminer les attributs spatiaux et le regroupement des éléments.Wang et al.44 soulignent que le SeOM est une technique d'apprentissage puissante connue pour sa capacité à regrouper et à imaginer des problèmes non linéaires. Contrairement à d'autres techniques de reconnaissance de formes telles que l'analyse en composantes principales, le regroupement flou, le regroupement hiérarchique et la prise de décision multicritère, le SeOM est meilleur pour organiser et identifier les modèles PTE. Selon Wang et al.44, SeOM peut regrouper spatialement la distribution des neurones associés et fournir une visualisation des données à haute résolution. SeOM visualisera les données de prédiction Ni pour obtenir le meilleur modèle pour caractériser les résultats pour une interprétation directe.
Cet article vise à générer un modèle de cartographie robuste avec une précision optimale pour prédire la teneur en nickel dans les sols urbains et périurbains.Nous émettons l'hypothèse que la fiabilité du modèle mixte dépend principalement de l'influence d'autres modèles attachés au modèle de base.Nous reconnaissons les défis auxquels est confronté le DSM, et bien que ces défis soient relevés sur plusieurs fronts, la combinaison des progrès de la géostatistique et des modèles MLA semble être progressive ;Par conséquent, nous essaierons de répondre aux questions de recherche qui peuvent produire des modèles mixtes. Cependant, quelle est la précision du modèle pour prédire l'élément cible ? De plus, quel est le niveau d'évaluation de l'efficacité basé sur la validation et l'évaluation de la précision ? pour créer une carte haute résolution de la variation spatiale du nickel.
L'étude est menée en République tchèque, plus précisément dans le district de Frydek Mistek dans la région de Moravie-Silésie (voir Figure 1). La géographie de la zone d'étude est très accidentée et fait principalement partie de la région des Beskides de Moravie-Silésie, qui fait partie de la bordure extérieure des Carpates. La zone d'étude est située entre 49° 41′ 0′ N et 18° 20′ 0′ E, et l'altitude est comprise entre 225 et 327 m ;cependant, le système de classification de Koppen pour l'état climatique de la région est noté Cfb = climat océanique tempéré, Il y a beaucoup de précipitations même pendant les mois secs. D'autre part, la superficie utilisée dans cette étude est d'environ 889,8 kilomètres carrés. À Ostrava et dans les environs, l'industrie sidérurgique et la métallurgie sont très actives. de nickel dans la région (par exemple, ajouter du nickel aux agneaux pour augmenter les taux de croissance des agneaux et des bovins à faible alimentation). D'autres utilisations industrielles du nickel dans les domaines de recherche comprennent son utilisation dans la galvanoplastie, y compris la galvanoplastie du nickel et les processus de nickelage autocatalytique. Les propriétés du sol se distinguent facilement de la couleur, de la structure et de la teneur en carbonate du sol. souvent avec béton et décoloration.Cependant, les cambisols et les stagnosols sont les types de sols les plus courants dans la région48.Avec des altitudes allant de 455,1 à 493,5 m, les cambisols dominent la République tchèque49.
Carte de la zone d'étude [La carte de la zone d'étude a été créée à l'aide d'ArcGIS Desktop (ESRI, Inc, version 10.7, URL : https://desktop.arcgis.com).]
Un total de 115 échantillons de sol arable ont été obtenus à partir de sols urbains et périurbains dans le district de Frydek Mistek. Le modèle d'échantillonnage utilisé était une grille régulière avec des échantillons de sol espacés de 2 × 2 km, et le sol arable a été mesuré à une profondeur de 0 à 20 cm à l'aide d'un appareil GPS portatif (Leica Zeno 5 GPS). Les échantillons sont emballés dans des sacs Ziploc, correctement étiquetés et expédiés au laboratoire. pulvérisé par un système mécanique (broyeur à disques Fritsch) et tamisé (taille de tamis 2 mm). Placer 1 gramme d'échantillons de sol séchés, homogénéisés et tamisés dans des bouteilles en téflon clairement étiquetées. plaque métallique chaude (température : 100 W et 160 °C) pendant 2 h pour faciliter le processus de digestion des échantillons, puis refroidir. Transférer le surnageant dans une fiole jaugée de 50 ml et diluer à 50 ml avec de l'eau déminéralisée. Après cela, filtrer le surnageant dilué dans un tube en PVC de 50 ml avec de l'eau déminéralisée. préparé pour la pseudo-concentration de PTE. Les concentrations de PTE (As, Cd, Cr, Cu, Mn, Ni, Pb, Zn, Ca, Mg, K) ont été déterminées par ICP-OES (inductively Coupled Plasma Optical Emission Spectroscopy) (Thermo Fisher Scientific, USA) selon des méthodes et un accord standard. Assurer les procédures d'assurance et de contrôle de la qualité (QA/QC) (SRM NIST 2711a Montana II Soil). moins de la moitié ont été exclus de cette étude. La limite de détection de la PTE utilisée dans cette étude était de 0,0004.(vous). De plus, le processus de contrôle et d'assurance qualité de chaque analyse est assuré par l'analyse d'étalons de référence. Pour s'assurer que les erreurs sont minimisées, une double analyse a été effectuée.
Le krigeage bayésien empirique (EBK) est l'une des nombreuses techniques d'interpolation géostatistique utilisées dans la modélisation dans divers domaines tels que la science du sol. Contrairement aux autres techniques d'interpolation par krigeage, EBK diffère des méthodes de krigeage traditionnelles en tenant compte de l'erreur estimée par le modèle de semi-variogramme. Dans l'interpolation EBK, plusieurs modèles de semi-variogramme sont calculés lors de l'interpolation, plutôt qu'un seul semi-variogramme. partie d'une méthode de krigeage suffisante. Le processus d'interpolation d'EBK suit les trois critères proposés par Krivoruchko50, (a) le modèle estime le semi-variogramme à partir de l'ensemble de données d'entrée (b) la nouvelle valeur prédite pour chaque emplacement de l'ensemble de données d'entrée en fonction du semi-variogramme généré et (c) le modèle A final est calculé à partir d'un ensemble de données simulé.
Lorsque \ (prob \ gauche (a \ droite) \) représente la probabilité marginale antérieure, \ (prob \ gauche (b \ droite) \). Observations du semi-semiriogramme.
Une machine à vecteurs de support est un algorithme d'apprentissage automatique qui génère un hyperplan de séparation optimal pour distinguer des classes identiques mais non linéairement indépendantes. Vapnik51 a créé l'algorithme de classification d'intention, mais il a récemment été utilisé pour résoudre des problèmes orientés vers la régression. comme une régression basée sur le noyau, dont le calcul a été effectué à l'aide d'un modèle de régression linéaire avec des fonctions spatiales multi-pays. John et al54 rapportent que la modélisation SVMR utilise une régression linéaire hyperplane, qui crée des relations non linéaires et permet des fonctions spatiales.55, epsilon (ε)-SVMR utilise l'ensemble de données formé pour obtenir un modèle de représentation en tant que fonction insensible à epsilon qui est appliquée pour cartographier les données indépendamment avec le meilleur biais epsilon de la formation sur des données corrélées. L'erreur de distance prédéfinie est ignorée de la valeur réelle, et si l'erreur est supérieure à ε (ε), les propriétés du sol la compensent. .
où b représente le seuil scalaire, \(K\left({x}_{,}{ x}_{k}\right)\) représente la fonction noyau, \(\alpha\) représente le multiplicateur de Lagrange, N représente un ensemble de données numériques, \({x}_{k}\) représente l'entrée de données et \(y\) est la sortie de données. L'un des principaux noyaux utilisés est l'opération SVMR, qui est une fonction de base radiale gaussienne (RBF). le modèle SVMR optimal, qui est essentiel pour obtenir le facteur d'ensemble de pénalités le plus subtil C et le paramètre de noyau gamma (γ) pour les données d'entraînement PTE. Nous avons d'abord évalué l'ensemble d'entraînement, puis testé les performances du modèle sur l'ensemble de validation. Le paramètre de direction utilisé est sigma et la valeur de la méthode est svmRadial.
Un modèle de régression linéaire multiple (MLR) est un modèle de régression qui représente la relation entre la variable de réponse et un certain nombre de variables prédictives en utilisant des paramètres groupés linéaires calculés à l'aide de la méthode des moindres carrés. Dans MLR, un modèle des moindres carrés est une fonction prédictive des propriétés du sol après sélection de variables explicatives.
où y est la variable de réponse, \(a\) est l'ordonnée à l'origine, n est le nombre de prédicteurs, \({b}_{1}\) est la régression partielle des coefficients, \({x}_{ i}\) représente un prédicteur ou une variable explicative, et \({\varepsilon }_{i}\) représente l'erreur dans le modèle, également appelée résidu.
Des modèles mixtes ont été obtenus en prenant en sandwich EBK avec SVMR et MLR. Cela se fait en extrayant les valeurs prédites de l'interpolation EBK. Les valeurs prédites obtenues à partir des Ca, K et Mg interpolés sont obtenues par un processus combinatoire pour obtenir de nouvelles variables, telles que CaK, CaMg et KMg. Les éléments Ca, K et Mg sont ensuite combinés pour obtenir une quatrième variable, CaKMg. Globalement, les variables obtenues sont Ca, K, Mg, CaK, CaMg , KMg et CaKMg.Ces variables sont devenues nos prédicteurs, aidant à prédire les concentrations de nickel dans les sols urbains et périurbains.L'algorithme SVMR a été appliqué sur les prédicteurs pour obtenir un modèle mixte Empirical Bayesian Kriging-Support Vector Machine (EBK_SVM). CaK, CaMg, KMg et CaKMg sont utilisés comme covariables comme prédicteurs de la teneur en Ni dans les sols urbains et périurbains. Le modèle le plus acceptable obtenu (EBK_SVM ou EBK_MLR) sera ensuite visualisé à l'aide d'un graphe auto-organisateur. Le flux de travail de cette étude est illustré à la figure 2.
L'utilisation de la SeOM est devenue un outil populaire pour organiser, évaluer et prévoir les données dans le secteur financier, la santé, l'industrie, les statistiques, la science du sol, etc. La SeOM est créée à l'aide de réseaux de neurones artificiels et de méthodes d'apprentissage non supervisées pour l'organisation, l'évaluation et la prédiction.57 décrivent la connexion d'un vecteur d'entrée dans un réseau de neurones via une seule couche d'entrée à un vecteur de sortie avec un seul vecteur de poids. La sortie générée par SeOM est une carte bidimensionnelle composée de différents neurones ou nœuds tissés en cartes topologiques hexagonales, circulaires ou carrées en fonction de leur proximité. En comparant les tailles de carte en fonction de la métrique, de l'erreur de quantification (QE) et de l'erreur topographique (TE), le modèle SeOM avec 0,086 et 0,904, respectivement, est sélectionné, qui est un 55- unité de carte (5 × 11). La structure du neurone est déterminée en fonction du nombre de nœuds dans l'équation empirique
Le nombre de données utilisées dans cette étude est de 115 échantillons. Une approche aléatoire a été utilisée pour diviser les données en données de test (25 % pour la validation) et en ensembles de données d'apprentissage (75 % pour l'étalonnage). L'ensemble de données d'apprentissage est utilisé pour générer le modèle de régression (étalonnage) et l'ensemble de données d'essai est utilisé pour vérifier la capacité de généralisation Les interpolations BK sont utilisées comme prédicteurs ou variables explicatives pour prédire la variable cible (PTE). La modélisation est gérée dans RStudio à l'aide de la bibliothèque de packages (Kohonen), de la bibliothèque (caret), de la bibliothèque (modeler), de la bibliothèque (« e1071 »), de la bibliothèque (« plyr »), de la bibliothèque (« caTools »), de la bibliothèque (« prospectr ») et des bibliothèques (« Metrics »).
Divers paramètres de validation ont été utilisés pour déterminer le meilleur modèle approprié pour prédire les concentrations de nickel dans le sol et pour évaluer l'exactitude du modèle et sa validation. Les modèles d'hybridation ont été évalués à l'aide de l'erreur absolue moyenne (MAE), de l'erreur quadratique moyenne (RMSE) et de la détermination du R-carré ou du coefficient (R2). R2 définit la variance des proportions dans la réponse, représentée par le modèle de régression. meilleur modèle de mélange utilisant les paramètres de validation, plus la valeur est proche de 1, plus la précision est élevée. Selon Li et al.59, une valeur de critère R2 de 0,75 ou plus est considérée comme un bon prédicteur ;de 0,5 à 0,75 est une performance de modèle acceptable, et en dessous de 0,5 est une performance de modèle inacceptable. Lors de la sélection d'un modèle à l'aide des méthodes d'évaluation des critères de validation RMSE et MAE, les valeurs inférieures obtenues étaient suffisantes et ont été considérées comme le meilleur choix. L'équation suivante décrit la méthode de vérification.
où n représente la taille de la valeur observée\({Y}_{i}\) représente la réponse mesurée, et \({\widehat{Y}}_{i}\) représente également la valeur de réponse prédite, par conséquent, pour les i premières observations.
Des descriptions statistiques des variables prédictives et de réponse sont présentées dans le tableau 1, montrant la moyenne, l'écart-type (écart-type), le coefficient de variation (CV), le minimum, le maximum, le kurtosis et le non-mal. De 4,86 ​​à 42,39 mg / kg.Combarison de Ni avec la moyenne mondiale (29 mg / kg) et la moyenne européenne (37 mg / kg) a montré que la moyenne géométrique calculée globale était dans la gamme tolérable. De plus en plus, la concentration moyenne de Frydek Mistek dans les sols urbains et périurbains dans la présente étude (NI 16,15 mg / kg) était plus élevée que la limite admissible de 60 (10,2 mg / kg) pour NI dans les sols urbains polonais signalés par Różański et al. S en toscane par rapport à l'étude actuelle. JIM62 a également trouvé une concentration en nickel plus faible (12,34 mg / kg) dans les sols urbains de Hong Kong, qui est inférieur à la concentration actuelle de nickel dans cette étude. la zone (16,15 mg / kg). Recherche actuelle. La teneur en nickel excessive dans les sols de certaines zones urbaines et suburbaines de la zone d'étude peut être principalement attribuée à l'industrie du fer et de la sidérurgie et de l'industrie des métaux.64 que l'industrie sidérurgique et la métallurgie sont les principales sources de contamination par le nickel des sols. Cependant, les prédicteurs variaient également de 538,70 mg/kg à 69 161,80 mg/kg pour le Ca, de 497,51 mg/kg à 3535,68 mg/kg pour le K et de 685,68 mg/kg à 5970,05 mg/kg pour Mg.Jakovljevic et al.65 ont étudié la teneur totale en Mg et K des sols du centre de la Serbie. Ils ont constaté que les concentrations totales (410 mg/kg et 400 mg/kg, respectivement) étaient inférieures aux concentrations de Mg et K de l'étude actuelle. kg) La teneur dans la couche arable est inférieure à l'élément unique dans cette étude. Une étude récente de Pongrac et al.67 ont montré que la teneur totale en Ca analysée dans 3 sols différents en Écosse, au Royaume-Uni (sol de Mylnefield, sol de Balruddery et sol de Hartwood) indiquait une teneur en Ca plus élevée dans cette étude.
En raison des différentes concentrations mesurées des éléments échantillonnés, les distributions des ensembles de données des éléments présentent une asymétrie différente. L'asymétrie et l'aplatissement des éléments variaient de 1,53 à 7,24 et de 2,49 à 54,16, respectivement. g et Ni présentent une variabilité modérée, tandis que Ca présente une variabilité extrêmement élevée. Les CV de K, Ni et Mg expliquent leur distribution uniforme. De plus, la distribution de Ca n'est pas uniforme et des sources externes peuvent affecter son niveau d'enrichissement.
La corrélation des variables prédictives avec les éléments de réponse a indiqué une corrélation satisfaisante entre les éléments (voir la figure 3). La corrélation a indiqué que CaK présentait une corrélation modérée avec la valeur r = 0,53, tout comme CaNi.Bien que Ca et K montrent des associations modestes entre eux, des chercheurs tels que Kingston et al.68 et Santo69 suggèrent que leurs niveaux dans le sol sont inversement proportionnels. Cependant, Ca et Mg sont antagonistes de K, mais CaK est bien corrélé. Cela peut être dû à l'application d'engrais tels que le carbonate de potassium, qui est 56 % plus riche en potassium. Le nickel est modérément corrélé avec Ca, K et Mg avec des valeurs r = 0,52, 0,63 et 0,55, respectivement. Les relations impliquant le calcium, le magnésium et les PTE comme le nickel sont complexes, mais néanmoins, le magnésium inhibe l'absorption du calcium, le calcium réduit les effets de l'excès de magnésium, et le magnésium et le calcium réduisent les effets toxiques du nickel dans le sol.
Matrice de corrélation pour les éléments montrant la relation entre les prédicteurs et les réponses (Remarque : cette figure comprend un nuage de points entre les éléments, les niveaux de signification sont basés sur p < 0,001).
La figure 4 illustre la distribution spatiale des éléments. Selon Burgos et al70, l'application de la distribution spatiale est une technique utilisée pour quantifier et mettre en évidence les points chauds dans les zones polluées. Les niveaux d'enrichissement en Ca de la figure 4 peuvent être vus dans la partie nord-ouest de la carte de distribution spatiale. le processus de fabrication de l'acier.D'autre part, d'autres agriculteurs préfèrent utiliser l'hydroxyde de calcium dans les sols acides pour neutraliser le pH, ce qui augmente également la teneur en calcium du sol71.Le potassium montre également des points chauds dans le nord-ouest et l'est de la carte. á et al.74, Asare et al.75, qui ont observé que la stabilisation du sol et le traitement au KCl et au NPK entraînaient une teneur élevée en K dans le sol.L'enrichissement spatial en potassium dans le nord-ouest de la carte de distribution peut être dû à l'utilisation d'engrais à base de potassium tels que le chlorure de potassium, le sulfate de potassium, le nitrate de potassium, la potasse et la potasse pour augmenter la teneur en potassium des sols pauvres. Zádorová et al.76 et Tlustoš et al.77 ont souligné que l'application d'engrais à base de K augmentait la teneur en K dans le sol et augmenterait considérablement la teneur en éléments nutritifs du sol à long terme, en particulier K et Mg montrant un point chaud dans le sol. Points chauds relativement modérés dans le nord-ouest de la carte et le sud-est de la carte. La fixation colloïdale dans le sol épuise la concentration de magnésium dans le sol. L'ésérite, traite les carences (les plantes apparaissent violettes, rouges ou brunes, indiquant une carence en magnésium) dans les sols dont le pH est normal6. L'accumulation de nickel sur les surfaces des sols urbains et périurbains peut être due à des activités anthropiques telles que l'agriculture et l'importance du nickel dans la production d'acier inoxydable78.
Répartition spatiale des éléments [la carte de répartition spatiale a été créée à l'aide d'ArcGIS Desktop (ESRI, Inc, version 10.7, URL : https://desktop.arcgis.com).]
Les résultats de l'indice de performance du modèle pour les éléments utilisés dans cette étude sont présentés dans le tableau 2. D'autre part, les RMSE et MAE de Ni sont tous deux proches de zéro (0,86 RMSE, -0,08 MAE). D'autre part, les valeurs RMSE et MAE de K sont acceptables. Les résultats RMSE et MAE étaient supérieurs pour le calcium et le magnésium. se sont avérés meilleurs que les résultats de John et al.54 en utilisant le krigeage synergique pour prédire les concentrations de S dans le sol en utilisant les mêmes données collectées. Les sorties EBK que nous avons étudiées sont en corrélation avec celles de Fabijaczyk et al.41, Yan et al.79, Béguin et al.80, Adhikary et al.81 et John et al.82, en particulier K et Ni.
La performance des méthodes individuelles de prédiction de la teneur en nickel dans les sols urbains et périurbains a été évaluée à l'aide des performances des modèles (tableau 3). (RMSE) et 77,368 mg/kg (MAE) Ca_Mg_K-SVMR était de 0,663 (R2), 235,974 mg/kg (RMSE) et 166,946 mg/kg (MAE). Néanmoins, de bonnes valeurs de R2 ont été obtenues pour Ca_Mg_K-SVMR (0,663 mg/kg R2) et Ca_Mg-EBK_SVMR (0,6 43 = R2);leurs résultats RMSE et MAE étaient supérieurs à ceux de Ca_Mg_K-EBK_SVMR (R2 0,637) (voir tableau 3). De plus, les RMSE et MAE du modèle Ca_Mg-EBK_SVMR (RMSE = 1664,64 et MAE = 1031,49) sont respectivement de 17,5 et 13,4, qui sont supérieurs à ceux du modèle Ca_Mg_K-EBK _SVMR. De même, les RMSE et MAE du modèle Ca_Mg-K SVMR (RMSE = 235,974 et MAE = 166,946) sont 2,5 et 2,2 plus grands que ceux du Ca_Mg_K-EBK_SVMR RMSE et MAE, respectivement. Les résultats RMSE calculés indiquent la concentration de l'ensemble de données avec la ligne de meilleur ajustement. Kebonye et al.46 et John et al.54, plus les RMSE et MAE sont proches de zéro, meilleurs sont les résultats. SVMR et EBK_SVMR ont des valeurs RSME et MAE quantifiées plus élevées. Il a été observé que les estimations RSME étaient systématiquement supérieures aux valeurs MAE, indiquant la présence de valeurs aberrantes. plus les valeurs MAE et RMSE sont élevées. La précision de l'évaluation de validation croisée du modèle mixte Ca_Mg_K-EBK_SVMR pour prédire la teneur en Ni dans les sols urbains et suburbains était de 63,70 %. Selon Li et al.59, ce niveau de précision est un taux de performance acceptable du modèle. Les présents résultats sont comparés à une étude précédente de Tarasov et al.36 dont le modèle hybride a créé MLPRK (Multilayer Perceptron Residual Kriging), lié à l'indice d'évaluation de la précision EBK_SVMR rapporté dans la présente étude, RMSE (210) et The MAE (167,5) étaient supérieurs à nos résultats dans la présente étude (RMSE 95,479, MAE 77,368). Cependant, en comparant le R2 de la présente étude (0,637) avec celui de Tarasov et al.36 (0,544), il est clair que le coefficient de détermination (R2) est plus élevé dans ce modèle mixte. La marge d'erreur (RMSE et MAE) (EBK SVMR) pour le modèle mixte est deux fois plus faible. SVMR) est de 63,7 %, tandis que la précision de prédiction obtenue par Sergeev et al.34 est de 28 %. La carte finale (Fig. 5) créée à l'aide du modèle EBK_SVMR et de Ca_Mg_K comme prédicteur montre des prédictions de points chauds et de nickel modérés à modérés sur l'ensemble de la zone d'étude. Cela signifie que la concentration de nickel dans la zone d'étude est principalement modérée, avec des concentrations plus élevées dans certaines zones spécifiques.
La carte de prédiction finale est représentée à l'aide du modèle hybride EBK_SVMR et de Ca_Mg_K comme prédicteur. [La carte de distribution spatiale a été créée à l'aide de RStudio (version 1.4.1717 : https://www.rstudio.com/).]
La figure 6 présente les concentrations de PTE sous la forme d'un plan de composition composé de neurones individuels. Aucun des plans composants ne présentait le même motif de couleur que celui illustré. g partagent certaines similitudes avec les neurones d'ordre très élevé et les motifs de couleur faibles à modérés. Les deux modèles prédisent la concentration de Ni dans le sol en affichant des teintes de couleurs moyennes à élevées telles que le rouge, l'orange et le jaune. motif de couleur varié de faible à élevé selon une échelle de couleurs précise. En outre, la prédiction du modèle de la teneur en nickel (CakMg) est similaire à la distribution spatiale du nickel illustrée à la figure 5. Les deux graphiques montrent des proportions élevées, moyennes et faibles de concentrations de nickel dans les sols urbains et périurbains. 5 échantillons de sol collectés, la catégorie 1 a obtenu le plus d'échantillons de sol, 74. Le cluster 2 a reçu 33 échantillons, tandis que le cluster 3 a reçu 8 échantillons. La combinaison de prédicteurs planaires à sept composants a été simplifiée pour permettre une interprétation correcte des clusters.
Sortie de plan de composant par chaque variable EBK_SVM_SeOM (Empirical Bayesian Kriging Support Vector Machine). [Les cartes SeOM ont été créées à l'aide de RStudio (version 1.4.1717 : https://www.rstudio.com/).]
Différents composants de classification de cluster [les cartes SeOM ont été créées à l'aide de RStudio (version 1.4.1717 : https://www.rstudio.com/).]
L'étude actuelle illustre clairement les techniques de modélisation des concentrations de nickel dans les sols urbains et périurbains. L'étude a testé différentes techniques de modélisation, combinant des éléments avec des techniques de modélisation, pour obtenir la meilleure façon de prédire les concentrations de nickel dans le sol. modèle de régression (Ca Mg K-SVMR) prédit la concentration de Ni dans le sol comme un modèle unique, mais les paramètres de validation et d'évaluation de la précision montrent des erreurs très élevées en termes de RMSE et MAE. D'autre part, la technique de modélisation employée avec le modèle EBK_MLR est également défectueuse en raison de la faible valeur du coefficient de détermination (R2). l'algorithme EBK avec un algorithme d'apprentissage automatique peut générer un algorithme hybride qui peut prédire la concentration de PTE dans le sol. Les résultats montrent que l'utilisation de Ca Mg K comme prédicteurs pour prédire les concentrations de Ni dans la zone d'étude peut améliorer la prédiction de Ni dans les sols. Cela signifie que l'application continue d'engrais à base de nickel et la pollution industrielle du sol par l'industrie sidérurgique ont tendance à augmenter la concentration de nickel dans le sol. sols. De manière générale, nous proposons d'appliquer le modèle EBK-SVMR pour évaluer et prédire la PTE dans le sol ;de plus, nous proposons d'utiliser EBK pour s'hybrider avec divers algorithmes d'apprentissage automatique. Les concentrations de Ni ont été prédites en utilisant des éléments comme covariables ;Cependant, l'utilisation de plus de covariables améliorerait considérablement les performances du modèle, ce qui peut être considéré comme une limitation du travail actuel. Une autre limitation de cette étude est que le nombre d'ensembles de données est de 115. Par conséquent, si plus de données sont fournies, les performances de la méthode d'hybridation optimisée proposée peuvent être améliorées.
PlantProbs.net.Nickel in Plants and Soil https://plantprobs.net/plant/nutrientImbalances/sodium.html (consulté le 28 avril 2021).
Kasprzak, KS Nickel progresse dans la toxicologie environnementale moderne. environnement. toxicologie.11, 145–183 (1987).
Cempel, M. & Nikel, G. Nickel: Un examen de ses sources et de la toxicologie environnementale.Polish J. Environment.Stud.15, 375–382 (2006).
Freedman, B. & Hutchinson, TC Apport de polluants de l'atmosphère et accumulation dans le sol et la végétation près d'une fonderie de nickel-cuivre à Sudbury, Ontario, Canada.can.J.Bot.58(1), 108-132.https://doi.org/10.1139/b80-014 (1980).
Manyiwa, T. et al.Métaux lourds dans le sol, les plantes et les risques associés au pâturage des ruminants près de la mine de cuivre-nickel de Selebi-Phikwe au Botswana.surroundings.Geochemistry.Health https://doi.org/10.1007/s10653-021-00918-x (2021).
Cabata-Pendias.Kabata-Pendias A. 2011. Oligoéléments dans le sol et… – Google Scholar https://scholar.google.com/scholar?hl=en&as_sdt=0%2C5&q=Kabata-Pendias+A.+2011.+Trace+ Elements+in+soils+and+plants.+4th+ed.+New+York+%28NY%29%3A +CRC+Press&btnG= (Consulté le 24 novembre 2020).
Almås, A., Singh, B., Agriculture, TS-NJ of & 1995, non défini. Effets de l'industrie russe du nickel sur les concentrations de métaux lourds dans les sols agricoles et les herbes à Soer-Varanger, Norway.agris.fao.org.
Nielsen, GD et al. L'absorption et la rétention du nickel dans l'eau potable sont liées à l'apport alimentaire et à la sensibilité au nickel.toxicology.application.Pharmacodynamics.154, 67–75 (1999).
Costa, M. & Klein, CB Nickel cancérogenèse, mutation, épigénétique ou sélection.environnement.Health Perspective.107, 2 (1999).
Ajman, CP ;Ajado, Sask.;Borůvka, L.;Bini, JKM;Sarkody, VYO ;Cobonye, ​​NM ;Analyse des tendances des éléments potentiellement toxiques : une revue bibliométrique. Géochimie environnementale et santé. Springer Science & Business Media BV 2020. https://doi.org/10.1007/s10653-020-00742-9.
Minasny, B. & McBratney, AB Digital Soil Mapping: A Brief History and Some Lessons.Geoderma 264, 301–311.https://doi.org/10.1016/j.geoderma.2015.07.017 (2016).
McBratney, AB, Mendonça Santos, ML & Minasny, B. Sur la cartographie numérique des sols. Geoderma 117(1-2), 3-52.https://doi.org/10.1016/S0016-7061(03)00223-4 (2003).
Deutsch.CV Geostatistical Reservoir Modeling,… – Google Scholar https://scholar.google.com/scholar?hl=en&as_sdt=0%2C5&q=CV+Deutsch%2C+2002%2C+Geostatistical+Reservoir+Modeling%2C +Oxford+University+Press%2C+376+pages.+&btnG= (Consulté le 28 avril 20 21).


Heure de publication : 22 juillet 2022
TOP