混合経験ベイズクリギングとサポートベクターマシン回帰を使用した郊外および都市土壌のニッケル濃度の予測

Nature.com をご覧いただきありがとうございます。使用しているブラウザのバージョンでは、CSS のサポートが制限されています。最高のエクスペリエンスを得るために、更新されたブラウザを使用することをお勧めします (または Internet Explorer の互換モードをオフにする)。それまでの間、継続的なサポートを確保するために、サイトはスタイルと JavaScript なしで表示されます。
土壌汚染は、人間の活動によって引き起こされる大きな問題です。潜在的有毒元素 (PTE) の空間分布は、ほとんどの都市部と都市近郊地域で異なります。したがって、そのような土壌における PTE の含有量を空間的に予測することは困難です。チェコ共和国の Frydek Mistek から合計 115 個のサンプルが入手されました。カルシウム (Ca)、マグネシウム (Mg)、カリウム (K)、およびニッケル (Ni) の濃度は、次の方法で測定されました。誘導結合プラズマ発光分光法。応答変数は Ni で、予測変数は Ca、Mg、K です。応答変数と予測変数の間の相関行列は、要素間の良好な相関を示しています。予測結果は、サポートベクターマシン回帰 (SVMR) の推定二乗平均誤差 (RMSE) (235.974 mg/kg) と平均絶対誤差 (MAE) (166.946 mg/kg) が他の方法よりも高かったにもかかわらず、良好なパフォーマンスを示しました。経験的ベイジアンクリギング多重線形回帰 (EBK-MLR) の混合モデルは、決定係数が 0.1 未満であることからわかるように、パフォーマンスが低いです。経験的ベイジアンクリギングサポートベクターマシン回帰 (EBK-SVMR) モデルは、RMSE (95.479 mg/kg) および MAE (77.368 mg/kg) の値が低く、決定係数 (R) が高く、最良のモデルでした。 EBK-SVMR モデリング手法の出力は、自己組織化マップを使用して視覚化されます。ハイブリッドモデル CakMg-EBK-SVMR コンポーネントの平面内のクラスター化されたニューロンは、都市および都市周辺土壌の Ni 濃度を予測する複数のカラーパターンを示します。結果は、EBK と SVMR の組み合わせが都市および都市周辺土壌の Ni 濃度を予測するための効果的な手法であることを示しています。
ニッケル (Ni) は、種子の発芽に必要な大気中の窒素固定 (N) と尿素の代謝に寄与するため、植物にとって微量栄養素とみなされます。種子の発芽への寄与に加えて、Ni は真菌および細菌の阻害剤としても作用し、植物の発育を促進します。土壌中にニッケルが不足すると植物がニッケルを吸収し、葉の白化を引き起こします。たとえば、ササゲやインゲンでは窒素を最適化するためにニッケルベースの肥料の適用が必要です。土壌を豊かにし、マメ科植物が土壌に窒素を固定する能力を高めるためにニッケルベースの肥料を継続的に適用すると、土壌中のニッケル濃度が継続的に増加します。ニッケルは植物にとって微量栄養素ですが、土壌への過剰摂取は良いことよりも害を及ぼす可能性があります。土壌中のニッケルの毒性は土壌のpHを最小限に抑え、植物の成長に必須の栄養素としての鉄の取り込みを妨げます1。Liu3によると、Niは17であることが判明しました。植物の発育と成長に必要な重要な元素です。植物の発育と成長におけるニッケルの役割に加えて、人間はさまざまな用途にニッケルを必要とします。電気めっき、ニッケル基合金の製造、自動車産業における点火装置と点火プラグの製造はすべて、さまざまな産業分野でニッケルの使用を必要とします。さらに、ニッケル基合金と電気めっき製品は、台所用品、ボールルーム付属品、食品産業用品、電気、電線とケーブル、ジェットタービン、外科用製品などで広く使用されています。土壌（表層土壌）中の Ni の豊富なレベルは、人為起源と自然起源の両方に起因すると考えられていますが、主に、Ni は人為起源ではなく天然起源です 4,6。ニッケルの天然起源には、火山噴火、植生、森林火災、および地質学的プロセスが含まれます。ただし、人為的発生源には、鉄鋼業におけるニッケル/カドミウム電池、電気めっき、アーク溶接、ディーゼル油および燃料油、石炭燃焼、廃棄物および汚泥焼却による大気排出、ニッケルの蓄積7、8が含まれます。図10に示されているように、近隣および隣接する環境における表土汚染の主な発生源は、主にニッケル銅ベースの製錬所と鉱山です。カナダのサドベリーニッケル銅製錬所周辺の表土は、26,000mg/kgという最高レベルのニッケル汚染がありました11。対照的に、ロシアでのニッケル生産による汚染により、ノルウェーの土壌ではニッケル濃度が高くなっています11。図 12 によると、この地域の最も耕作可能な土地 (ロシアのニッケル生産量) における HNO3 抽出可能なニッケルの量は 6.25 ～ 136.88 mg/kg の範囲であり、平均 30.43 mg/kg およびベースライン濃度 25 mg/kg に相当します。kabashi 11 によれば、連続する作期中に都市または都市近郊の土壌の農地土壌にリン肥料を施用すると、リン肥料が注入される可能性があります。人間におけるニッケルの潜在的な影響は、突然変異誘発、染色体損傷、Z-DNA 生成、DNA 切除修復の阻害、またはエピジェネティックなプロセスを通じて癌を引き起こす可能性があります 13。動物実験では、ニッケルにはさまざまな腫瘍を引き起こす可能性があることが判明しており、発癌性ニッケル錯体はそのような腫瘍を悪化させる可能性があります。
土壌汚染評価は、土壌と植物の関係、土壌と土壌の生物学的関係、生態学的劣化、および環境影響評価から生じる幅広い健康関連問題により、近年盛んになっています。これまで、土壌中の Ni などの潜在的有毒元素 (PTE) の空間予測は、従来の方法を使用すると手間と時間がかかりました。デジタル土壌マッピング (DSM) の出現と現在の成功 15 により、予測土壌マッピング (PSM) は大幅に改善されました。ミナスニー氏とマック氏によると、 Bratney16 によると、予測土壌マッピング (DSM) は、土壌科学の顕著な下位分野であることが証明されています。Lagacherie と McBratney、2006 は、DSM を「現場および実験室での観察方法と、空間的および非空間的土壌推論システムの使用による、空間的土壌情報システムの作成と充填」と定義しています。McBratney et al.17 は、現代の DSM または PSM が、PTE、土壌の種類、および土壌特性の空間分布を予測またはマッピングするための最も効果的な技術であることを概説しています。地球統計および機械学習アルゴリズム (MLA) は、重要かつ最小限のデータを使用してコンピューターの助けを借りてデジタル化された地図を作成する DSM モデリング技術です。
Deutsch18 と Olea19 は、地球統計学を「時系列分析が時間データを特徴付ける方法など、主に確率モデルを使用して、空間属性の表現を扱う数値手法の集合」と定義しています。主に、地球統計学にはバリオグラムの評価が含まれます。これにより、各データセットからの空間値の依存関係を定量化し、定義できるようになります20。Gumiaux et al.図 20 はさらに、地球統計におけるバリオグラムの評価が、(a) データ相関スケールの計算、(b) データセットの不均衡の異方性の特定と計算、(c) 局所効果から分離された測定データの固有誤差を考慮することに加えて、面積効果も推定されるという 3 つの原則に基づいていることを示しています。これらの概念に基づいて、一般クリギング、共クリギング、通常クリギングなどの多くの補間技術が地球統計学で使用されています。クリギング、経験的ベイジアンクリギング、単純クリギング法、および PTE、土壌特性、および土壌タイプをマッピングまたは予測するためのその他のよく知られた内挿技術。
機械学習アルゴリズム (MLA) は、より大規模な非線形データクラスを採用する比較的新しい手法であり、主にデータマイニング、データ内のパターンの識別に使用されるアルゴリズムによって強化され、土壌科学やリターンタスクなどの科学分野の分類に繰り返し適用されます。Tan らの論文など、土壌中の PTE を予測するために MLA モデルに依存する多数の研究論文が存在します。22 (農地土壌の重金属推定のためのランダムフォレスト)、Sakizadeh et al.23 (サポートベクターマシンと人工ニューラルネットワークを使用したモデリング) 土壌汚染)。24 (土壌中の重金属の保持と吸着をモデル化するための CART) Sun et al.25 (キュービストの適用は土壌中の Cd の分布です) および k 最近傍法、一般化ブースト回帰、ブースト回帰などの他のアルゴリズムも Trees は土壌中の PTE を予測するために MLA を適用しました。
予測またはマッピングにおける DSM アルゴリズムの適用は、いくつかの課題に直面しています。多くの著者は、MLA が地球統計よりも優れており、その逆も同様であると信じています。一方が他方よりも優れているとはいえ、2 つを組み合わせることで、DSM におけるマッピングまたは予測の精度のレベルが向上します15。Woodcock と Gopal26 Finke27。Pontius と Cheuk28 および Grunwald29 は、予測土壌マッピングにおける欠陥といくつかのエラーについてコメントしています。土壌科学者は、DSM マッピングと予測の有効性、精度、予測可能性を最適化するためにさまざまな手法を試みてきました。不確実性と検証の組み合わせは、有効性を最適化し、欠陥を減らすために DSM に統合されるさまざまな側面の 1 つです。15 では、地図の品質を向上させるために、地図の作成と予測によってもたらされる検証動作と不確実性を独立して検証する必要があると概説しています。DSM の限界は、地理的に分散した土壌の品質によるものであり、これには不確実性の要素が含まれます。ただし、DSM における確実性の欠如は、共変量誤差、モデル誤差、位置誤差、分析誤差などの複数の誤差原因から発生する可能性があります 31. MLA および地球統計プロセスで引き起こされるモデリングの不正確さは理解の欠如と関連しており、最終的に実際のプロセスの過度の単純化につながります 32. モデリングの性質に関係なく、不正確さはモデリングパラメータ、数学的モデルの予測、または内挿に起因する可能性があります 33。地図作成と予測における地球統計と MLA の統合を促進する新しい DSM トレンドが出現しました。Sergeev らのような数人の土壌科学者や著者が、34;スボティナら。35;タラソフら。36およびタラソフら。37 社は、正確な品質の地球統計と機械学習を利用して、予測と地図作成の効率を向上させるハイブリッドモデルを生成しました。これらのハイブリッドまたは複合アルゴリズムモデルには、人工ニューラルネットワーククリギング (ANN-RK)、多層パーセプトロン残差クリギング (MLP-RK)、一般化回帰ニューラルネットワーク残差クリギング (GR-NNRK)36、人工ニューラルネットワーククリギング-多層パーセプトロン (ANN-K-MLP)37、および共クリギングとガウスプロセス回帰 38 があります。
Sergeevらによると、さまざまなモデリング技術を組み合わせることで、単一のモデルを開発するよりも、欠陥を排除し、結果として得られるハイブリッドモデルの効率を向上させる可能性があるという。これに関連して、この新しい論文は、都市および都市周辺地域のNi濃縮度を予測する最適なハイブリッドモデルを作成するには、地球統計学とMLAの組み合わせアルゴリズムを適用する必要があると主張している。この研究は、ベースモデルとして経験的ベイジアンクリギング(EBK)に依存し、それをサポートベクターマシン(SVM)および多重線形再計算と混合する。回帰 (MLR) モデル。EBK と MLA のハイブリッド化は不明です。見られる複数の混合モデルは、通常、残差、回帰クリギング、および MLA の組み合わせです。EBK は、場全体で定義された局在化パラメーターを持つ非定常/定常ランダム場として局在化される空間確率過程を利用する地球統計学的内挿法であり、空間変動を考慮します39。EBK は、有機物の分布の分析を含むさまざまな研究で使用されています。農場の土壌中の炭素40、土壌汚染の評価41、土壌特性のマッピング42。
一方、自己組織化グラフ (SeOM) は、Li et al. などのさまざまな論文で適用されている学習アルゴリズムです。43、王ら。44、ホセイン・ブイヤンら。45 および Kebonye et al.46 要素の空間属性とグループ化を決定します。Wang et al。SeOM は、非線形問題をグループ化して想像する能力で知られる強力な学習手法であると概要を述べています。主成分分析、ファジークラスタリング、階層的クラスタリング、複数基準の意思決定などの他のパターン認識手法とは異なり、SeOM は PTE パターンを整理して識別することに優れています。SeOM は、関連するニューロンの分布を空間的にグループ化し、高解像度のデータ視覚化を提供します。SeOM は、Ni 予測データを視覚化して、結果を特徴付けて直接解釈するための最適なモデルを取得します。
この論文は、都市および都市近郊の土壌のニッケル含有量を予測するための最適な精度を備えた堅牢なマッピングモデルを生成することを目的としています。混合モデルの信頼性は主に、基本モデルに付加された他のモデルの影響に依存すると仮説を立てています。DSM が直面している課題を認識しており、これらの課題は複数の面で対処されていますが、地球統計学と MLA モデルの進歩の組み合わせは段階的に進んでいるように見えます。したがって、混合モデルを生成する可能性のある研究の疑問に答えようとします。ただし、モデルは対象元素の予測にどの程度正確ですか?また、検証と精度評価に基づく効率評価のレベルはどの程度ですか?したがって、この研究の具体的な目標は、(a) 基本モデルとして EBK を使用して SVMR または MLR の混合混合モデルを作成すること、(b) 得られたモデルを比較すること、(c) 都市または都市近郊の土壌の Ni 濃度を予測するための最適な混合モデルを提案すること、および (d) の適用SeOM を使用して、ニッケルの空間変動の高解像度マップを作成します。
この調査はチェコ共和国、特にモラヴィア・シレジア地域のフリーデク・ミステク地区で実施されています（図 1 を参照）。調査地域の地理は非常に険しく、大部分がカルパティア山脈の外縁の一部であるモラヴィア・シレジア・ベスキディ地域の一部です。調査地域は北緯 49 度 41 分 0 分と東経 18 度 20 分 0 分の間に位置しており、標高は 225 ～ 327 m です。ただし、この地域の気候状態を示すケッペン分類システムでは Cfb = 温帯海洋性気候と評価されており、乾季でも降水量が多い。気温は年間を通じて -5 °C ～ 24 °C の間でわずかに変化し、-14 °C を下回ったり 30 °C を超えることはめったにないが、平均年間降水量は 685 ～ 752 mm47 である。地域全体の推定調査面積は面積は1,208平方キロメートルで、耕地面積の39.38％、森林被覆率の49.36％を占めます。一方、この研究で使用した面積は約889.8平方キロメートルです。オストラヴァとその周辺では、鉄鋼業と金属加工が非常に活発です。金属工場、鉄鋼業では、ステンレス鋼（大気腐食に対する耐性など）や合金鋼（ニッケルは合金の強度を維持しながら合金の強度を高めます）にニッケルが使用されます。延性と靭性）、リン酸塩肥料の施用や家畜生産などの集約農業は、この地域の潜在的なニッケル供給源の研究対象となっている（例えば、子羊や低給餌牛の成長率を高めるために子羊にニッケルを添加する）。研究分野におけるニッケルのその他の産業用途には、電気メッキニッケルや無電解ニッケルメッキプロセスなどの電気メッキでの使用が含まれる。土壌の特性は土壌の色、構造、炭酸塩含有量から簡単に区別できる。土壌の質感は中程度から細かい。母材に由来します。それらは本質的に崩積、沖積、または風成です。一部の土壌地域は、表面と下層土にまだらのように見え、多くの場合、コンクリートと白化が見られます。しかし、カンビソルとスタニョソルは、この地域で最も一般的な土壌タイプです48。標高が455.1～493.5メートルの範囲にあるカンビソルは、チェコ共和国を支配しています49。
調査エリアマップ [調査エリアマップは ArcGIS Desktop (ESRI, Inc、バージョン 10.7、URL: https://desktop.arcgis.com) を使用して作成されました。]
フリデク・ミステック地区の都市および都市近郊の土壌から合計 115 個の表土サンプルが得られました。使用されたサンプルパターンは、土壌サンプルが 2 × 2 km 離れた規則的なグリッドであり、表土は手持ちの GPS デバイス (Leica Zeno 5 GPS) を使用して 0 ～ 20 cm の深さで測定されました。サンプルはジップロック袋に梱包され、適切にラベルが貼られて研究室に発送されます。サンプルは風乾されて粉砕されます。乾燥させ、均質化し、ふるい分けした土壌サンプル 1 グラムを、明確にラベルを付けたテフロンボトルに入れます。各テフロン容器に 35% HCl 7 ml と 65% HNO3 3 ml を分注し (自動ディスペンサーを使用 - 各酸に 1 つずつ)、軽く覆い、サンプルを一晩放置します。反応（王水プログラム）。サンプルの消化プロセスを促進するために、上清を熱い金属プレート（温度：100 W、160 °C）上に 2 時間置き、その後冷却します。上清を 50 ml メスフラスコに移し、脱イオン水で 50 ml に希釈します。その後、希釈した上清を脱イオン水で 50 ml PVC チューブに濾過します。さらに、1希釈溶液 ml を 9 ml の脱イオン水で希釈し、PTE 擬似濃縮用に準備した 12 ml チューブに濾過しました。PTE (As、Cd、Cr、Cu、Mn、Ni、Pb、Zn、Ca、Mg、K) の濃度は、標準的な方法と合意に従って、ICP-OES (誘導結合プラズマ発光分光法) (Thermo Fisher Scientific、米国) によって測定しました。品質保証および管理 (QA/QC) 手順 (SRM NIST 2711a モンタナ II 土壌)。検出限界が半分未満の PTE はこの研究から除外されました。この研究で使用された PTE の検出限界は 0.0004 でした。(あなた)。さらに、各分析の品質管理および品質保証プロセスは、参照標準を分析することによって保証されます。エラーが最小限に抑えられることを保証するために、二重分析が実行されました。
経験的ベイジアンクリギング (EBK) は、土壌科学などのさまざまな分野のモデリングに使用される多くの地球統計学的内挿手法の 1 つです。他のクリギング内挿手法とは異なり、EBK はセミバリオグラムモデルによって推定される誤差を考慮する点で従来のクリギング手法とは異なります。EBK 内挿では、単一のセミバリオグラムではなく、複数のセミバリオグラムモデルが内挿中に計算されます。内挿手法は、このセミバリオグラムのプロットに関連する不確実性とプログラミングに取って代わられます。これは、十分なクリギング法の非常に複雑な部分を構成します。EBK の内挿プロセスは、Krivoruchko50 によって提案された 3 つの基準に従います。(a) モデルは、入力データセットからセミバリオグラムを推定します。(b) 生成されたセミバリオグラムに基づいて、各入力データセットの位置の新しい予測値を生成します。(c) 最終的な A モデルは、シミュレートされたデータセットから計算されます。ベイズ方程式ルールは、事後関数として与えられます。
\(Prob\left(A\right)\) は事前確率を表します。 \(Prob\left(B\right)\) の周辺確率は、ほとんどの場合 \(Prob (B,A)\ ) として無視されます。セミバリオグラムの計算は、セミバリオグラムから作成できる観測データセットの傾向を示すベイズ則に基づいています。その後、セミバリオグラムの値は、セミバリオグラムから観測データセットが作成される可能性を示すベイズ則を使用して決定されます。グラム。
サポートベクターマシンは、同一だが線形独立ではないクラスを区別するための最適な分離超平面を生成する機械学習アルゴリズムです。Vapnik51 は意図分類アルゴリズムを作成しましたが、最近では回帰指向の問題を解決するために使用されています。Li et al.52 によると、SVM は最良の分類技術の 1 つであり、さまざまな分野で使用されています。この分析では SVM の回帰コンポーネント (サポートベクターマシン回帰 – SVMR) が使用されました。Cherkassky とMulier 53 は、カーネルベースの回帰として SVMR を開拓し、その計算は複数国の空間関数を使用した線形回帰モデルを使用して実行されました。John ら 54 は、SVMR モデリングが非線形関係を作成し、空間関数を可能にする超平面線形回帰を採用していると報告しています。Vohland らによると、図 55 に示すように、イプシロン (ε)-SVMR は、トレーニングされたデータセットを使用して、相関データのトレーニングから最適なイプシロンバイアスを使用してデータを個別にマッピングするために適用されるイプシロン非感受性関数として表現モデルを取得します。事前に設定された距離誤差は実際の値から無視され、誤差が ε(ε) より大きい場合、土壌特性によって補正されます。また、モデルはトレーニングデータの複雑さをサポートベクターのより広範なサブセットに低減します。Vapnik51 によって提案された方程式が示されています。以下。
ここで、 b はスカラーしきい値を表し、\(K\left({x}_{,}{ x}_{k}\right)\) はカーネル関数を表し、\(\alpha\) はラグランジュ乗数を表し、N は数値データセットを表し、\({x}_{k}\) はデータ入力を表し、\(y\) はデータ出力を表します。使用される主要なカーネルの 1 つは、ガウス動径基底関数 (RBF) である SVMR 演算です。 RBF カーネルは、最適な SVMR モデルを決定するために適用されます。これは、PTE トレーニングデータの最も微妙なペナルティセット係数 C とカーネルパラメーターガンマ (γ) を取得するために重要です。最初にトレーニングセットを評価し、次に検証セットでモデルのパフォーマンスをテストしました。使用されるステアリングパラメーターは sigma で、メソッドの値は svmRadial です。
重線形回帰モデル (MLR) は、最小二乗法を使用して計算された線形プールパラメータを使用して、応答変数と多数の予測変数の間の関係を表す回帰モデルです。MLR では、最小二乗モデルは、説明変数を選択した後の土壌特性の予測関数です。説明変数を使用して線形関係を確立するには、応答を使用する必要があります。説明変数と線形関係を確立するために、応答変数として PTE を使用しました。MLR 方程式は次のとおりです。
ここで、y は応答変数、\(a\) は切片、n は予測子の数、\({b}_{1}\) は係数の偏回帰、\({x}_{ i}\) は予測子または説明変数を表し、\({\varepsilon }_{i}\) はモデルの誤差 (残差とも呼ばれます) を表します。
混合モデルは、EBKをSVMRおよびMLRで挟むことによって得られます。これは、EBK補間から予測値を抽出することによって行われます。補間されたCa、K、およびMgから得られる予測値は、組み合わせ処理を通じて取得され、CaK、CaMg、およびKMgなどの新しい変数が得られます。要素Ca、K、およびMgは、次に結合されて4番目の変数CaKMgが得られます。全体として、得られる変数はCa、K、Mgです。、CaK、CaMg、KMg、および CaKMg です。これらの変数は予測変数となり、都市および都市近郊の土壌のニッケル濃度の予測に役立ちます。SVMR アルゴリズムが予測変数に対して実行され、混合モデルの経験的ベイジアンクリギングサポートベクターマシン (EBK_SVM) が取得されました。同様に、変数も MLR アルゴリズムを通じてパイプ処理され、混合モデルの経験的ベイジアンクリギング多重線形回帰 (E) BK_MLR)。通常、変数 Ca、K、Mg、CaK、CaMg、KMg、および CaKMg は、都市および都市近郊土壌の Ni 含有量の予測変数として共変量として使用されます。得られた最も許容可能なモデル (EBK_SVM または EBK_MLR) は、自己組織化グラフを使用して視覚化されます。この研究のワークフローを図 2 に示します。
SEOMの使用は、金融セクター、ヘルスケア、産業、統計、土壌科学などでデータを整理、評価、予測するための人気のあるツールになりました。SEOMは、組織、評価、予測のための人工ニューラルネットワークと栄養型の学習方法を使用して作成されています。 Ensional Vector変数43,56.Melssen et al。57 では、単一の入力層を介して単一の重みベクトルを持つ出力ベクトルへのニューラルネットワークへの入力ベクトルの接続について説明しています。 SeOM によって生成される出力は、近接性に応じて六角形、円形、または正方形のトポロジマップに織り込まれたさまざまなニューロンまたはノードで構成される 2 次元マップです。メトリック、量子化誤差 (QE) および地形誤差 (TE) に基づいてマップサイズを比較すると、それぞれ 0.086 と 0.904 の SeOM モデルが選択されます。、これは 55 マップユニット (5 × 11) です。ニューロンの構造は経験式のノードの数に従って決定されます。
この研究で使用されたデータの数は 115 サンプルです。データをテストデータ (検証用 25%) とトレーニングデータセット (キャリブレーション用 75%) に分割するためにランダムアプローチが使用されました。トレーニングデータセットは回帰モデル (キャリブレーション) の生成に使用され、テストデータセットは一般化能力の検証に使用されます 58。これは土壌中のニッケル含有量を予測するためのさまざまなモデルの適合性を評価するために行われました。使用されたすべてのモデルは 10 倍の相互検証プロセスを経ました。 EBK 補間によって生成された変数は、ターゲット変数 (PTE) を予測するための予測子または説明変数として使用されます。モデリングは、ライブラリ (Kohonen)、ライブラリ (caret)、ライブラリ (modelr)、ライブラリ (“e1071”)、ライブラリ (“plyr”)、ライブラリ (“caTools”)、ライブラリ (“プロスペクタ”) およびライブラリ (“メトリクス”) のパッケージを使用して RStudio で処理されます。
土壌中のニッケル濃度の予測に適した最適なモデルを決定し、モデルとその検証の精度を評価するために、さまざまな検証パラメーターが使用されました。ハイブリダイゼーションモデルは、平均絶対誤差 (MAE)、二乗平均平方根誤差 (RMSE)、および R2 乗または係数決定 (R2) を使用して評価されました。R2 は、回帰モデルで表される、答えの比率の分散を定義します。独立した測定値の RMSE と分散の大きさはモデルの予測力を表し、MAE は決定します。実際の定量値。検証パラメータを使用して最適混合モデルを評価するには、R2 値が高くなければなりません。値が 1 に近づくほど、精度が高くなります。Li et al.59 では、0.75 以上の R2 基準値が良好な予測子とみなされます。0.5 ～ 0.75 は許容可能なモデルのパフォーマンスであり、0.5 未満は許容できないモデルのパフォーマンスです。RMSE および MAE 検証基準の評価方法を使用してモデルを選択する場合、得られた値が低いほど十分であり、最良の選択とみなされます。次の式は検証方法を説明します。
ここで、n は観測値のサイズを表します\({Y}_{i}\) は測定された応答を表し、\({\widehat{Y}}_{i}\) は最初の i 番目の観測値の予測応答値も表します。
予測変数と応答変数の統計的説明を表 1 に示します。平均、標準偏差 (SD)、変動係数 (CV)、最小値、最大値、尖度、歪度を示します。元素の最小値と最大値は、それぞれ Mg < Ca < K < Ni および Ca < Mg < K < Ni の降順です。調査地域からサンプリングされた応答変数 (Ni) の濃度は 4.86 ～ 42.39 mg/kg の範囲でした。 Ni を世界平均 (29 mg/kg) およびヨーロッパ平均 (37 mg/kg) と比較すると、研究地域の計算された幾何平均全体が許容範囲内であることが示されました。それにもかかわらず、Kabashi-Pendias 11 が示すように、今回の研究における平均ニッケル (Ni) 濃度とスウェーデンの農地土壌との比較では、現在の平均ニッケル濃度の方が高いことが示されています。同様に、都市および都市近郊の土壌におけるフリーデク・ミステックの平均濃度は、現在の研究 (Ni 16.15 mg/kg) は、Różański らによって報告されたポーランドの都市土壌における Ni の許容限度値 60 (10.2 mg/kg) よりも高かった。さらに、Bretzel と Calderisi61 は、現在の研究と比較して、トスカーナの都市土壌で非常に低い平均 Ni 濃度 (1.78 mg/kg) を記録した。Jim62 はまた、より低いニッケル濃度 (12.34 mg/kg) を発見した。香港の都市土壌におけるニッケル濃度は、この研究における現在のニッケル濃度よりも低い。Birke et al63 は、ドイツのザクセン・アンハルト州の古い鉱山および都市工業地帯で平均 Ni 濃度 17.6 mg/kg を報告したが、これはその地域の平均 Ni 濃度 (16.15 mg/kg) よりも 1.45 mg/kg 高かった。現在の研究。調査地域の一部の都市および郊外地域の土壌中の過剰なニッケル含有量は、主に次のようなものである可能性がある。これは、Khodadoust らの研究と一致しています。鉄鋼業と金属加工が土壌中のニッケル汚染の主な発生源であることは64。しかし、予測因子の範囲もCaについては538.70 mg/kgから69,161.80 mg/kg、Kについては497.51 mg/kgから3535.68 mg/kg、Mgについては685.68 mg/kgから5970.05 mg/kgでした。アル。65 は中央セルビアの土壌の Mg と K の総含有量を調査した。彼らは総濃度 (それぞれ 410 mg/kg と 400 mg/kg) が現在の研究の Mg と K 濃度より低いことを発見した。ポーランド東部では区別がつかないが、Orzechowski と Smolczynski 66 は Ca、Mg、K の総含有量を評価し、Ca (1100 mg/kg)、Mg (590 mg) の平均濃度を示した。 /kg) および K (810 mg/kg) 表土中の含有量は、この研究の単一元素よりも低いです。67 は、英国スコットランドの 3 つの異なる土壌 (ミルンフィールド土壌、バルラダリー土壌、ハートウッド土壌) で分析された総 Ca 含有量が、この研究の方がより高い Ca 含有量を示していることを示しました。
サンプリングされた要素の測定濃度が異なるため、要素のデータセット分布は異なる歪度を示します。要素の歪度と尖度は、それぞれ 1.53 ～ 7.24、2.49 ～ 54.16 の範囲でした。計算されたすべての要素の歪度と尖度レベルは +1 を超えており、データ分布が不規則で、正しい方向に歪んでおり、ピークがあることを示しています。要素の推定 CV からも、K 、Mg、Ni は中程度の変動を示しますが、Ca は非常に高い変動を示します。K、Ni、Mg の CV はそれらの均一な分布を説明しています。さらに、Ca の分布は不均一であり、外部ソースがその濃縮レベルに影響を与える可能性があります。
予測変数と応答要素の相関関係は、要素間の満足のいく相関関係を示しました (図 3 を参照)。この相関関係は、CaK が CaNi と同様に r 値 = 0.53 で中程度の相関を示すことを示しました。Ca と K は互いに適度な関連性を示しましたが、Kingston らの研究者は、68 および Santo69 は、土壌中のそれらのレベルが反比例していることを示唆しています。ただし、Ca と Mg は K と拮抗していますが、CaK はよく相関しています。これは、カリウムが 56% 高い炭酸カリウムなどの肥料の施用によるものと考えられます。カリウムはマグネシウムと中程度の相関関係がありました (KM r = 0.63)。肥料産業では、これら 2 つの元素は、硫化カリウム、マグネシウムが含まれるため、密接に関連しています。酸塩、硝酸マグネシウムカリウム、およびカリは、欠乏レベルを高めるために土壌に施用されます。ニッケルは、Ca、K、および Mg と適度に相関しており、r 値はそれぞれ 0.52、0.63、0.55 です。カルシウム、マグネシウム、およびニッケルなどの PTE に関する関係は複雑ですが、それでも、マグネシウムはカルシウムの吸収を阻害し、カルシウムは過剰なマグネシウムの影響を軽減し、両方のマグネシウムは過剰なマグネシウムの影響を軽減します。ネシウムとカルシウムは土壌中のニッケルの有害な影響を軽減します。
予測変数と応答の間の関係を示す要素の相関行列 (注: この図には要素間の散布図が含まれており、有意水準は p < 0,001 に基づいています)。
図 4 は、元素の空間分布を示しています。Burgos et al70 によれば、空間分布の適用は、汚染地域のホットスポットを定量化し強調表示するために使用される手法です。図 4 の Ca 濃縮レベルは、空間分布マップの北西部で見ることができます。この図は、中程度から高レベルの Ca 濃縮ホットスポットを示しています。マップの北西部でのカルシウム濃縮は、生石灰 (酸化カルシウム) の使用によるものと考えられます。土壌の酸性度を低下させ、製鉄プロセスでアルカリ性酸素として製鉄所で使用される。一方、他の農家はpHを中和するために酸性土壌で水酸化カルシウムを使用することを好み、これにより土壌のカルシウム含有量も増加する71。カリウムは地図の北西部と東部にもホットスポットを示している。北西部は主要な農業コミュニティであり、カリウムの中程度から高濃度のパターンはNPKとカリの散布によるものである可能性がある。これはマダラスやリパフスクなどの他の研究と一致している。 ý72、Madaras et al.73、Pulkrabová et al.74、Asare et al.75 は、土壌の安定化と KCl および NPK による処理により、土壌中の K 含有量が高くなるという結果を観察しました。分布図の北西部における空間的なカリウムの濃縮は、痩せた土壌のカリウム含有量を増加させるために、塩化カリウム、硫酸カリウム、硝酸カリウム、カリ、カリなどのカリウムベースの肥料を使用したためである可能性があります。76およびTlustošら。77 は、K ベースの肥料の施用により土壌中の K 含有量が増加し、長期的には土壌養分含量が大幅に増加すると概説しました。特に K と Mg は土壌中のホットスポットを示しています。マップの北西部とマップの南東部には比較的中程度のホットスポットがあります。土壌中のコロイド固定により、土壌中のマグネシウム濃度が枯渇します。土壌が不足すると、植物は黄色がかった葉脈間萎黄病を示します。マグネシウムベースの肥料など硫酸マグネシウムカリウム、硫酸マグネシウム、およびキーゼライトは、正常な pH 範囲の土壌で欠乏症 (植物は紫、赤、または茶色に見え、マグネシウム欠乏症を示します) を治療します 6。都市および都市近郊の土壌表面へのニッケルの蓄積は、農業などの人為的活動やステンレス鋼生産におけるニッケルの重要性によるものである可能性があります 78。
要素の空間分布 [空間分布マップは ArcGIS Desktop (ESRI, Inc、バージョン 10.7、URL: https://desktop.arcgis.com) を使用して作成されました。]
この研究で使用された元素のモデル性能指数の結果を表 2 に示します。一方、Ni の RMSE と MAE は両方ともゼロに近い (0.86 RMSE、-0.08 MAE)。一方、K の RMSE と MAE の値はどちらも許容可能です。RMSE と MAE の結果はカルシウムとマグネシウムでより大きくなっています。Ca と K の MAE と RMSE の結果は、データセットが異なるためより大きくなっています。この研究の RMSE と MAE EBK を使用して Ni を予測することは、John らの結果よりも優れていることがわかりました。54 は、同じ収集データを使用して相乗的クリギングを使用して土壌中の S 濃度を予測しました。私たちが研究した EBK 出力は、Fabijaczyk らの出力と相関しています。41、ヤンら。79、ビギンら。80、Adhikaryら。81およびジョンら。82、特に K と Ni。
都市および都市近郊土壌のニッケル含有量を予測するための個々の方法の性能は、モデルの性能を使用して評価されました (表 3)。モデルの検証と精度評価により、EBK SVMR モデルと組み合わせた Ca_Mg_K 予測子が最高の性能を発揮することが確認されました。校正モデル Ca_Mg_K-EBK_SVMR モデル R2、二乗平均平方根誤差 (RMSE) および平均絶対誤差 (MAE) は 0.637 (R2)、95.47 でした。 9 mg/kg (RMSE) および 77.368 mg/kg (MAE) Ca_Mg_K-SVMR は 0.663 (R2)、235.974 mg/kg (RMSE) および 166.946 mg/kg (MAE) でした。それにもかかわらず、Ca_Mg_K-SVMR (0.663 mg/kg R2) および Ca_Mg-EBK_SV では良好な R2 値が得られました。 MR (0.643 = R2);RMSE および MAE の結果は、Ca_Mg_K-EBK_SVMR (R2 0.637) の結果よりも高かった (表 3 を参照)。さらに、Ca_Mg-EBK_SVMR (RMSE = 1664.64 および MAE = 1031.49) モデルの RMSE および MAE はそれぞれ 17.5 および 13.4 であり、Ca_Mg_K-EBK_ モデルの RMSE および MAE よりも大きくなりました。同様に、Ca_Mg-K SVMR (RMSE = 235.974 および MAE = 166.946) モデルの RMSE および MAE は、Ca_Mg_K-EBK_SVMR の RMSE および MAE よりもそれぞれ 2.5 および 2.2 大きくなっています。計算された RMSE の結果は、データセットが最適な線にどれだけ集中しているかを示します。より高い RSME および MAE が観察されました。Ke 氏によるとボニーら。46およびジョンら。54、RMSE と MAE がゼロに近づくほど、結果は良好になります。SVMR と EBK_SVMR は、量子化された RSME および MAE 値が高くなります。RSME 推定値が一貫して MAE 値よりも高いことが観察され、外れ値の存在を示しています。Legates と McCabe83 によると、RMSE が平均絶対誤差 (MAE) をどの程度超えるかが、外れ値の存在の指標として推奨されています。これは、異種成分が多いことを意味します。データセットを使用するほど、MAE および RMSE 値が高くなります。都市および郊外の土壌中の Ni 含有量を予測するための Ca_Mg_K-EBK_SVMR 混合モデルの相互検証評価の精度は 63.70% でした。図 59 に示すように、このレベルの精度は許容可能なモデルのパフォーマンス率です。今回の結果は、Tarasov らによる以前の研究と比較されます。ハイブリッドモデルが現在の研究で報告されているEBK_SVMR精度評価指数に関連するMLPRK（多層パーセプトロン残差クリギング）を作成した36 RMSE（210）およびMAE（167.5）は、現在の研究での結果よりも高かった（RMSE 95.479、MAE 77.368）。。36 (0.544)、決定係数 (R2) がこの混合モデルの方が高いことは明らかです。混合モデルの誤差範囲 (RMSE および MAE) (EBK SVMR) は 2 倍低いです。同様に、Sergeev ら 34 は、開発されたハイブリッドモデル (多層パーセプトロン残差クリギング) で 0.28 (R2) を記録しましたが、今回の研究の Ni は 0.637 (R2) を記録しました。このモデル (EBK SVMR) のレベルは 63.7% ですが、Sergeev らによって得られた予測精度は 63.7% です。EBK_SVMR モデルと予測変数として Ca_Mg_K を使用して作成された最終マップ (図 5) は、調査地域全体にわたるホットスポットと中程度からニッケルの予測を示しています。これは、調査地域のニッケル濃度は主に中程度で、一部の特定の地域ではより高い濃度であることを意味します。
最終的な予測マップは、ハイブリッドモデル EBK_SVMR を使用し、予測子として Ca_Mg_K を使用して表されます。[空間分布マップは、RStudio (バージョン 1.4.1717: https://www.rstudio.com/) を使用して作成されました。]
図 6 に、個々のニューロンから構成される組成面として PTE 濃度を示します。示されているように同じ色パターンを示す構成面はありませんでした。ただし、描画されたマップごとに適切なニューロン数は 55 です。SeOM はさまざまな色を使用して生成され、色パターンが類似するほど、サンプルの特性がより類似します。正確なカラースケールによると、個々の元素 (Ca、K、および Mg) は、単一の高ニューロンおよびほとんどの低ニューロンと同様のカラーパターンを示しました。 CaMg は、非常に高次のニューロンおよび低から中程度のカラーパターンといくつかの類似点を共有しています。両方のモデルは、赤、オレンジ、黄色などの中から高の色相を表示することにより、土壌中の Ni 濃度を予測します。KMg モデルは、正確な比率と低から中程度のカラーパッチに基づいて多くの高カラーパターンを表示します。低から高までの正確なカラースケールで、モデルのコンポーネントの平面分布パターンは、土壌中のニッケルの潜在的濃度を示す高カラーパターンを示しました (図 4 を参照)。モデルコンポーネントの平面は、正確なカラースケールに従って、低から高までの多様なカラーパターンを示します。さらに、モデルのニッケル含有量 (CakMg) の予測は、図 5 に示すニッケルの空間分布と類似しています。どちらのグラフも、都市および都市近郊の土壌におけるニッケル濃度の高、中、低の割合を示しています。図 7 は、各モデルの予測値に基づいて 3 つのクラスターに分割された、地図上の K 平均法グループ化におけるコンター法を示しています。等高線法はクラスターの最適な数を表します。収集された 115 個の土壌サンプルのうち、カテゴリー 1 が最も多くの土壌サンプル (74 個) を取得しました。クラスター 2 は 33 個のサンプルを受け取り、クラスター 3 は 8 個のサンプルを受け取りました。クラスターを正しく解釈できるように、7 成分の平面予測子の組み合わせが単純化されました。土壌形成に影響を与える多数の人為的プロセスと自然プロセスのため、分散型 SeOM マップで適切に区別されたクラスターパターンを持つことは困難です78。
各 Empirical Bayesian Kriging Support Vector Machine (EBK_SVM_SeOM) 変数によるコンポーネントプレーン出力。[SeOM マップは RStudio (バージョン 1.4.1717: https://www.rstudio.com/) を使用して作成されました。]
さまざまなクラスター分類コンポーネント [SeOM マップは RStudio (バージョン 1.4.1717: https://www.rstudio.com/) を使用して作成されました。]
現在の研究は、都市および都市近郊の土壌におけるニッケル濃度のモデリング技術を明確に示しています。この研究では、土壌中のニッケル濃度を予測する最良の方法を得るために、要素とモデリング技術を組み合わせて、さまざまなモデリング技術をテストしました。モデリング技術の SeOM 組成平面空間特徴は、正確なカラースケールで低から高までの高いカラーパターンを示し、土壌中の Ni 濃度を示しました。ただし、空間分布マップは、EBK_SVMR によって示された成分の平面空間分布を確認しています (参照)図5)。結果は、サポートベクターマシン回帰モデル(Ca Mg K-SVMR)が単一モデルとして土壌中のNi濃度を予測することを示していますが、検証および精度評価パラメータはRMSEおよびMAEに関して非常に高い誤差を示しています。一方、EBK_MLRモデルで使用されるモデリング手法にも、決定係数(R2)の値が低いため欠陥があります。EBK SVMRとRMSEが低い複合要素(CaKMg)を使用して良好な結果が得られ、良好な結果が得られました。 MAE エラーの精度は 63.7% でした。EBK アルゴリズムと機械学習アルゴリズムを組み合わせると、土壌中の PTE 濃度を予測できるハイブリッドアルゴリズムを生成できることがわかりました。その結果、調査地域の Ni 濃度を予測するための予測因子として Ca Mg K を使用すると、土壌中の Ni の予測が改善できることがわかりました。これは、ニッケルベースの肥料の継続的な適用と鉄鋼業による土壌の産業汚染が、土壌中のニッケル濃度を増加させる傾向があることを意味します。この研究では、EBK モデルが次のことを明らかにしました。誤差のレベルを削減し、都市または都市近郊の土壌における土壌空間分布モデルの精度を向上させることができます。一般に、土壌中の PTE を評価および予測するために EBK-SVMR モデルを適用することを提案します。さらに、EBK を使用してさまざまな機械学習アルゴリズムとハイブリッド化することを提案します。Ni 濃度は、元素を共変量として使用して予測されました。ただし、より多くの共変量を使用すると、モデルのパフォーマンスが大幅に向上しますが、これは現在の研究の限界であると考えられます。この研究のもう 1 つの限界は、データセットの数が 115 であることです。したがって、より多くのデータが提供される場合、提案された最適化されたハイブリダイゼーション法のパフォーマンスは向上する可能性があります。
PlantProbs.net.植物と土壌中のニッケル https://plantprobs.net/plant/nutrientImbalances/sodium.html (2021 年 4 月 28 日にアクセス)。
カスプルザック、カンザス州ニッケルの現代環境毒性学における進歩.周囲.毒性学.11、145–183 (1987)。
Cempel, M. & Nikel, G. Nickel: その発生源と環境毒性学のレビュー。Polish J. Environmental.Stud.15、375–382 (2006)。
Freedman, B. & Hutchinson, TC カナダ、オンタリオ州サドベリーのニッケル銅精錬所付近の大気からの汚染物質の流入と土壌および植生への蓄積。can.J。Bot.58(1)、108-132.https://doi.org/10.1139/b80-014 (1980)。
Manyiwa, T. et al. 土壌、植物中の重金属、およびボツワナのセレビ・ピクウェ銅ニッケル鉱山近くの放牧反芻動物に関連するリスク.surroundings.Geochemistry.Health https://doi.org/10.1007/s10653-021-00918-x (2021)。
カバタ-ペンディアス.カバタ-ペンディアス A. 2011. 土壌中の微量元素と… – Google Scholar https://scholar.google.com/scholar?hl=ja&as_sdt=0%2C5&q=Kabashi-Pendias+A.+2011.+Trace+ Elements+in+soils+and+plants.+4th+ed.+New+York+%28NY%29%3A +CRC+Press&btnG= (2020 年 11 月 24 日にアクセス)。
Almås, A.、Singh, B.、農業、TS-NJ of & 1995、未定義。ノルウェー、Soer-Varanger の農地土壌および草の重金属濃度に対するロシアのニッケル産業の影響。agris.fao.org。
Nielsen, GD et al. 飲料水中のニッケルの吸収と保持は、食物摂取とニッケル感受性に関連しています。毒性学.application.Pharmacodynamics.154, 67–75 (1999)。
Costa, M. & Klein, CB ニッケルの発癌、突然変異、エピジェネティクスまたは選択、周囲の健康の展望、107、2 (1999)。
アジュマーン、PC;アジャド、サウスカロライナ州。ボルフカ、L.ビニ、JKM。サルコディ、VYO;ニューメキシコ州コボニー。潜在的に有毒な元素の傾向分析: 書誌学的レビュー。環境地球化学と健康。Springer Science & Business Media BV 2020。https://doi.org/10.1007/s10653-020-00742-9。
Minasny, B. & McBratney, AB デジタル土壌マッピング: 簡単な歴史といくつかの教訓.Geoderma 264, 301–311.https://doi.org/10.1016/j.geoderma.2015.07.017 (2016)。
McBratney, AB、Mendonça Santos, ML、Minasny, B. デジタル土壌マッピングについて。Geoderma 117(1-2)、3-52。https://doi.org/10.1016/S0016-7061(03)00223-4 (2003)。
Deutsch.CV 地球統計学的貯留層モデリング、… – Google Scholar https://scholar.google.com/scholar?hl=ja&as_sdt=0%2C5&q=CV+Deutsch%2C+2002%2C+Geostatistical+Reservoir+Modeling%2C +Oxford+University+Press%2C+376+pages.+&btnG= (A 2021年4月28日にアクセス済み）。

投稿日時: 2022 年 7 月 22 日