ヨーロッパの多次水文学的位置 — 水文学における機械学習と分析のための一連の機能

ブログ

ホームページホームページ / ブログ / ヨーロッパの多次水文学的位置 — 水文学における機械学習と分析のための一連の機能

Jun 22, 2024

ヨーロッパの多次水文学的位置 — 水文学における機械学習と分析のための一連の機能

Scientific Data volume 9、記事番号: 662 (2022) この記事を引用 1083 アクセス 5 Altmetric Metrics の詳細 提示されたデータセット EU-MOHP v013.1.1 は、

Scientific Data volume 9、記事番号: 662 (2022) この記事を引用

1083 アクセス

5 オルトメトリック

メトリクスの詳細

提示されたデータセット EU-MOHP v013.1.1 は、それぞれの河川ネットワークおよび集水域内の地理的地点の水文位置 (MOHP) に関するマルチスケール情報をグリッド マップとして提供します。 より正確には、最も近い河川と集水分水界までの距離の合計としての「分水界と集水域の距離」(DSD)、最も近い川と集水分水界の間の位置の相対的な測定値としての「横方向位置」(LP)の 3 つの尺度で構成されます。 「ストリーム距離」(SD)は、最も近いストリームまでの距離です。 これら 3 つの尺度は、地域から大陸までのさまざまな空間スケールを反映するために、9 つの水文次数に対して計算されます。 その空間範囲は欧州経済領域 (EEA39) の主要部分をカバーしており、地理学上のヨーロッパともほぼ一致しています。 潜在的な使用例は複数ありますが、このデータセットは主に、機械学習を使用したマッピングやタスクの予測など、水文地質学的および水文モデリングのための貴重な静的環境記述子または予測変数として機能します。 このデータセットの生成には無料のオープンソース ソフトウェアのみが使用されるため、他のリージョンまたは入力データセットに転送できます。

測定

ストリーム距離への分割 – 横位置 – ストリーム距離

テクノロジーの種類

リモートセンシング

サンプル特性 - 環境

流域・地下集水域・集水域

サンプルの特徴 - 場所

ヨーロッパ

近年、機械学習などのデータ サイエンス ツールが水文 (地質) 学的課題や研究課題に適用され、特に開発されることが増えています 1,2。 水文地質学の分野では、機械学習は地下水位予測やさまざまな地図作成タスクにうまく使用されています3、4、5、6、7、8、9、10、11、12、13。 機械学習モデルは、ハイブリッド モデルまたは物理ガイド モデルを除き、物理プロセスの知識を持たない純粋なデータに基づいているため、ターゲット変数に影響を与える意味のある特徴 (予測変数または説明変数とも呼ばれる) を提供することが重要です。機械学習アルゴリズムが入力とターゲットの間の関数をモデル化できること。 地表および地表近くのプロセスの場合、この基準はリモートセンシングデータの利用可能性によって多かれ少なかれ満たすことができますが、水文地質学などの地下プロセスのモデル化の場合、これは深刻な課題を引き起こします。

このデータセットの主な動機は、流域内の点の水平位置に関​​する水文学的コンテキストを機械学習モデルに導入する一連の特徴を提供することで、このギャップを部分的に埋めることです。 この水平位置によって決定される 3 つの測定値は、いくつかのいわゆる水文次数に対して計算されます。 水文秩序は、地方から地域、大陸に至るまで、さまざまな空間スケールを表します。 したがって、この測定値は、複数のスケールでの水文系の地球物理学的特性の代用として機能し、土地利用と土地被覆、地質図または土壌図などの一般的に利用可能および使用されている特徴を補完します。 このデータセットは、Belitz et al.14 に強く影響を受けており、彼らのアイデアと手法を「EU-Hydro - River Network Database」15 に適合させていますが、対照的に、無料のオープンソース ソフトウェアを使用し、再現性に重点を置いています。 この概念は、提示された手法を HYDRO1k16 や MERIT Hydro-Vector17 などの地球規模の河川ネットワークや水路図データセットに適用することで空間的にさらに拡張できます。 概念と手法の詳細な背景については、Belitz et al.14 を参照してください。

Belitz ら 14 は、研究の中で、機械学習を使用してさまざまな地球物理学的ターゲット変数をマッピングする際に、多次の水文学的位置が貴重な特徴であることを証明するケーススタディの結果も提供しています。 機械学習モデルのパフォーマンスに対する利点は、他のいくつかの研究でも認められています7、18、19。

 = i are used, whereas those with stream order _public_beta_v009.gpkg” and the second with “euhydro__v011.gpkg”. The coastline data is stored in a single Shapefile (.shp) file (see Fig. 4b). All files have a total size of approximately 14 GB when unzipped./p>___.tif”. The placeholders including “<” and “>” can be theoretically replaced by any combination of the values summarized in Table 2. But not all study area polygons have a river network for each hydrologic order. For example, the study area polygon for the island of Sardinia only has rivers up to a maximum streamorder of 6 and therefore only a maximum hydrologic order of 6. This means that there are no GeoTIFF files for Sardinia for hydrologic orders 7–9. Therefore, the total number of files is \({n}_{measures}\cdot {\sum }_{i=1}^{{n}_{hydrologicorders}}{n}_{studyareapolygons,i}=3\cdot {\sum }_{i=1}^{9}{n}_{studyareapolygons,i}=192\)./p> = dsd”). If required, a potential solution to this could be to fill these NA cells with values from the nearest non-NA grid cell as a simple approximation./p>, proxy = TRUE) before applying st_crop(). To simplify some of the previous steps, we developed the R package eumohpclipr (https://github.com/MxNl/eumohpclipr/)33. This package provides functionality to mosaic, crop or clip and plot the EU-MOHP dataset20. For a fast raster cell value extraction based on polygons, the R package exactextractr (https://github.com/isciences/exactextractr)34 is recommended./p> = lp”) must be divided by 100 to obtain percentages with two decimal digits or by 10,000 to obtain values in the range from 0 to 1. The cell values of all other files represent a distance in meters and can be used as is. All files are stored using the coordinate reference system (CRS) ETRS89-extended/LAEA Europe with the EPSG code 3035./p>