dirs for framework

iHeadWater · May 31, 2024 · 332218a · 332218a
1 parent 279d3b0
commit 332218a
Show file tree

Hide file tree

Showing 52 changed files with 958 additions and 960 deletions.
diff --git a/README_CN.md b/README_CN.md
@@ -1,7 +1,7 @@
 <!--
  * @Author: Wenyu Ouyang
  * @Date: 2024-02-12 09:52:49
- * @LastEditTime: 2024-05-30 09:08:47
+ * @LastEditTime: 2024-05-31 10:30:30
  * @LastEditors: Wenyu Ouyang
  * @Description: 中文版README
  * @FilePath: \hydroevaluate\README_CN.md
@@ -16,3 +16,27 @@
 此外，关于模型评估的研究也很多，后续会不断补充进相关程序以更深入地探讨。
 
 **注：此项目刚刚启动**
+
+## 安装
+
+```bash
+pip install hydroevaluate
+```
+
+## 使用
+
+TODO: 待定
+
+## 设计思路与框架
+
+首先，本仓库定位是在torchhydro和hydromodel训练模型后，在这两个仓库能进行模拟评估的基础上进行真正的预报评估。
+
+主要的流程就是：直接对接的是这两个仓库的率定/训练后的模型，然后接收指定的输入数据，加载模型并进行实际预报（的模拟），然后对得到的结果进行分析评估，并输出保存或者发送到指定的地方。
+
+所以相应的模块主要就包括以下五个环节：
+
+- 模型加载
+- 数据加载
+- 预报
+- 评估
+- 输出
diff --git a/docs/source/conf.py b/docs/source/conf.py
@@ -17,8 +17,8 @@
 
 # -- Project information -----------------------------------------------------
 
-project = "hydro-model-xaj"
-copyright = "2021, Ouyang,Wenyu"
+project = "hydroevaluate"
+copyright = "2024, Ouyang,Wenyu"
 author = "Ouyang,Wenyu"
 
 # The full version, including alpha/beta/rc tags

diff --git a/docs/source/hydromodel.app.rst b/docs/source/hydromodel.app.rst
diff --git a/docs/source/hydromodel.calibrate.rst b/docs/source/hydromodel.calibrate.rst
diff --git a/docs/source/hydromodel.models.rst b/docs/source/hydromodel.models.rst
diff --git a/docs/source/img/xaj.jpg b/docs/source/img/xaj.jpg
diff --git a/docs/source/img/xaj_.jpg b/docs/source/img/xaj_.jpg
diff --git a/docs/source/index.rst b/docs/source/index.rst
@@ -1,9 +1,9 @@
-.. hydro-model-xaj documentation master file, created by
-   sphinx-quickstart on Fri Dec 10 08:29:52 2021.
+.. hydroevaluate documentation master file, created by
+   sphinx-quickstart on Fri May 31 08:29:52 2024.
    You can adapt this file completely to your liking, but it should at least
    contain the root `toctree` directive.
 
-Welcome to hydro-model-xaj's documentation!
+Welcome to hydroevaluate's documentation!
 ===========================================
 
 .. toctree::

diff --git a/docs/source/modules.rst b/docs/source/modules.rst
@@ -1,7 +1,7 @@
-hydromodel
+hydroevaluate
 ==========
 
 .. toctree::
    :maxdepth: 4
 
-   hydromodel
+   hydroevaluate
diff --git a/env-dev.yml b/env-dev.yml
@@ -0,0 +1,20 @@
+name: hydroevaluate
+channels:
+  - pytorch
+  - conda-forge
+  - defaults
+dependencies:
+  - python=3.11
+  - pytest
+  - black
+  - flake8
+  - pip
+  - pip:
+    - hydromodel
+    - torchhydro
+    - mlflow
+    - hydra-core
+    - setuptools
+    - wheel
+    - twine
+    - bump2version
diff --git a/env.yml b/env.yml
diff --git a/hydroevaluate/GPM_GFS_Scaler_2_stat.json → ...oevaluate/conf/GPM_GFS_Scaler_2_stat.json b/hydroevaluate/GPM_GFS_Scaler_2_stat.json → ...oevaluate/conf/GPM_GFS_Scaler_2_stat.json
diff --git a/hydroevaluate/aiff_v002.yml → hydroevaluate/conf/aiff_v002.yml b/hydroevaluate/aiff_v002.yml → hydroevaluate/conf/aiff_v002.yml
diff --git a/hydroevaluate/conf/config.py b/hydroevaluate/conf/config.py
@@ -0,0 +1,183 @@
+"""
+Author: Wenyu Ouyang
+Date: 2023-10-25 18:49:02
+LastEditTime: 2023-10-31 21:11:12
+LastEditors: Wenyu Ouyang
+Description: Some configs for minio server
+FilePath: \hydro_privatedata\hydroprivatedata\config.py
+Copyright (c) 2023-2024 Wenyu Ouyang. All rights reserved.
+"""
+
+import logging
+import pathlib
+import os
+import boto3
+import hydrodataset as hds
+from minio import Minio
+import s3fs
+
+import json
+
+import yaml
+
+from hydroevaluate.hydroevaluate import private_yml
+
+from torchhydro.configs.config import cmd, default_config_file, update_cfg
+from torchhydro.datasets.data_dict import data_sources_dict
+from torchhydro.trainers.trainer import set_random_seed
+
+
+MINIO_SERVER = "http://minio.waterism.com:9000"
+LOCAL_DATA_PATH = None
+
+minio_paras = {
+    "endpoint_url": MINIO_SERVER,
+    "access_key": "",
+    "secret_key": "",
+    "bucket_name": "test",
+}
+
+home_path = str(pathlib.Path.home())
+
+if os.path.exists(os.path.join(home_path, ".wisminio")):
+    for line in open(os.path.join(home_path, ".wisminio")):
+        key = line.split("=")[0].strip()
+        value = line.split("=")[1].strip()
+        # print(key,value)
+        if key == "endpoint_url":
+            minio_paras["endpoint_url"] = value
+        elif key == "access_key":
+            minio_paras["access_key"] = value
+        elif key == "secret_key":
+            minio_paras["secret_key"] = value
+        elif key == "bucket_path":
+            minio_paras["bucket_name"] = value
+
+if os.path.exists(os.path.join(home_path, ".hydrodataset")):
+    settings_path = os.path.join(home_path, ".hydrodataset", "settings.json")
+    if not os.path.exists(settings_path):
+        with open(settings_path, "w+") as fp:
+            json.dump({"local_data_path": None}, fp)
+    with open(settings_path, "r+") as fp:
+        settings_json = json.load(fp)
+    LOCAL_DATA_PATH = settings_json["local_data_path"]
+
+
+if LOCAL_DATA_PATH is None:
+    """
+    hydro_warning.no_directory(
+        "LOCAL_DATA_PATH",
+        "Please set local_data_path in ~/.hydrodataset, otherwise, you can't use the local data.",
+    )
+    """
+    logging.warning(
+        msg="Please set local_data_path in ~/.hydrodataset, otherwise, you can't use the local data."
+    )
+
+# Set up MinIO client
+s3 = boto3.client(
+    "s3",
+    endpoint_url=MINIO_SERVER,
+    aws_access_key_id=minio_paras["access_key"],
+    aws_secret_access_key=minio_paras["secret_key"],
+)
+mc = Minio(
+    MINIO_SERVER.replace("http://", ""),
+    access_key=minio_paras["access_key"],
+    secret_key=minio_paras["secret_key"],
+    secure=False,
+)
+site_bucket = "stations"
+site_object = "sites.csv"
+
+fs = s3fs.S3FileSystem(
+    client_kwargs={"endpoint_url": minio_paras["endpoint_url"]},
+    key=minio_paras["access_key"],
+    secret=minio_paras["secret_key"],
+)
+
+ro = {
+    "client_kwargs": {"endpoint_url": minio_paras["endpoint_url"]},
+    "key": minio_paras["access_key"],
+    "secret": minio_paras["secret_key"],
+}
+
+
+def custom_cfg(
+    cfgs_path,
+):
+    f = open(cfgs_path, encoding="utf-8")
+    cfgs = yaml.load(f.read(), Loader=yaml.FullLoader)
+    config_data = default_config_file()
+    """
+    remote_obj_array = ['1_02051500.nc', '86_21401550.nc', 'camelsus_attributes.nc', 'merge_streamflow.nc']
+    bucket_name = 'forestbat-private'
+    folder_prefix = 'predicate_data'
+    minio_obj_list = ['s3://' + bucket_name + '/' + folder_prefix + '/' + i for i in remote_obj_array]
+    test_data_list = test_read_valid_data(minio_obj_list)
+    """
+    args = cmd(
+        sub=cfgs["data_cfgs"]["sub"],
+        source=cfgs["data_cfgs"]["source"],
+        source_region=cfgs["data_cfgs"]["source_region"],
+        source_path=hds.ROOT_DIR,
+        streamflow_source_path=os.path.join(hds.ROOT_DIR, "merge_streamflow.nc"),
+        rainfall_source_path=hds.ROOT_DIR,
+        attributes_path=os.path.join(hds.ROOT_DIR, "camelsus_attributes.nc"),
+        gfs_source_path="",
+        download=0,
+        ctx=cfgs["data_cfgs"]["ctx"],
+        model_name=cfgs["model_cfgs"]["model_name"],
+        model_hyperparam={
+            "seq_length": 168,
+            "forecast_length": 24,
+            "n_output": 1,
+            "n_hidden_states": 60,
+            "dropout": 0.25,
+            "len_c": 15,
+            "in_channels": 1,
+            "out_channels": 8,
+        },
+        weight_path=os.path.join(
+            pathlib.Path(os.path.abspath(os.curdir)).parent.parent,
+            cfgs["model_cfgs"]["weight_dir"],
+        ),
+        loss_func=cfgs["training_cfgs"]["loss_func"],
+        sampler=cfgs["data_cfgs"]["sampler"],
+        dataset=cfgs["data_cfgs"]["dataset"],
+        scaler=cfgs["data_cfgs"]["scaler"],
+        batch_size=cfgs["training_cfgs"]["batch_size"],
+        var_t=[["tp"]],
+        var_c=cfgs["data_cfgs"]["constant_cols"],
+        var_out=["streamflow"],
+        # train_period=train_period,
+        # test_period的dict和拼接数据的periods存在一定抵触
+        test_period=[
+            {"start": "2017-07-01", "end": "2017-09-29"},
+        ],  # 该范围为降水的时间范围，流量会整体往后推24h
+        opt=cfgs["training_cfgs"]["opt"],
+        train_epoch=cfgs["training_cfgs"]["train_epoch"],
+        save_epoch=cfgs["training_cfgs"]["save_epoch"],
+        te=cfgs["training_cfgs"]["te"],
+        gage_id=["1_02051500", "86_21401550"],
+        which_first_tensor=cfgs["training_cfgs"]["which_first_tensor"],
+        continue_train=cfgs["training_cfgs"]["continue_train"],
+        rolling=cfgs["data_cfgs"]["rolling"],
+        metrics=cfgs["test_cfgs"]["metrics"],
+        endpoint_url=private_yml["minio"]["server_url"],
+        access_key=private_yml["minio"]["access_key"],
+        secret_key=private_yml["minio"]["secret"],
+        # bucket_name=bucket_name,
+        # folder_prefix=folder_prefix,
+        # stat_dict_file=os.path.join(train_path, "GPM_GFS_Scaler_2_stat.json"),
+        user="zxw",
+    )
+    update_cfg(config_data, args)
+    random_seed = config_data["training_cfgs"]["random_seed"]
+    set_random_seed(random_seed)
+    data_cfgs = config_data["data_cfgs"]
+    data_source_name = data_cfgs["data_source_name"]
+    data_source = data_sources_dict[data_source_name](
+        data_cfgs["data_path"], data_cfgs["download"]
+    )
+    return data_source, config_data  # , minio_obj_list
diff --git a/hydroevaluate/eval_log.json → hydroevaluate/conf/eval_log.json b/hydroevaluate/eval_log.json → hydroevaluate/conf/eval_log.json
diff --git a/scripts/conf/v001.yml → hydroevaluate/conf/v001.yml b/scripts/conf/v001.yml → hydroevaluate/conf/v001.yml
diff --git a/scripts/conf/v002.yml → hydroevaluate/conf/v002.yml b/scripts/conf/v002.yml → hydroevaluate/conf/v002.yml