如何存储和读取replay buffer为h5文件 #529

jaried · 2022-10-31T03:13:43Z

PaParaZz1 · 2022-10-31T08:55:47Z

你这里要缓存的数据是指，是 replay buffer 里的数据吗，具体有多大

jaried · 2022-10-31T09:58:12Z

是的，大概12M条，直接保存h5内存根本放不下保存过程中产生的数据，需要分块保存。

我之前用tianshou的VectorReplayBuffer就是根据env_id来分块保存的，只有整体保存时间的1/4-1/3，而且不需要多大内存。整体保存，我的256G内存都不够用。

obs大小大概如下：

        self._observation_space = _observation_space = gym.spaces.Dict(
            {
                'agent_state': gym.spaces.Box(
                    low=-1, high=1, shape=(4,336), dtype=np.float32
                ),
                'global_state': gym.spaces.Box(
                    low=-1, high=1, shape=(4, 994), dtype=np.float32
                )
            }
        )

PaParaZz1 · 2022-11-08T08:16:31Z

首先第一点，你这个环境的state数据可以适当压缩吗，比如可以用uint8表示的其实没必要用float32。如果这个可以在环境里修改，那么存储在replay buffer中的数据就可以大概缩小为原来的四分之一
然后对于replay buffer内部，我理解这个功能需求，相当于是将replay buffer里的数据通过某种方式，自动转换成h5放到磁盘里，如果读到这部分数据，再去h5里面读一下，从而减少对内存的占用是吗？

jaried · 2022-11-09T03:04:19Z

首先第一点，你这个环境的state数据可以适当压缩吗，比如可以用uint8表示的其实没必要用float32。如果这个可以在环境里修改，那么存储在replay buffer中的数据就可以大概缩小为原来的四分之一

目前我用的是sac算法，需要做obs缩放，所以obs用的是-1到1的区间。

然后对于replay buffer内部，我理解这个功能需求，相当于是将replay buffer里的数据通过某种方式，自动转换成h5放到磁盘里，如果读到这部分数据，再去h5里面读一下，从而减少对内存的占用是吗？

replay buffer我是这么用的，1、因为我的env使用了大量数据，数据的质量不一定可控，而且我的env可能会出现bug，为了避免训练时出现异常，我采用了定期存replay buffer的方法，出现异常后可以继续训练。2、我的数据每天更新，因为sac是off-policy，所以第二次训练时，网络权重从0开始，并且读上次训练出好的模型的replay buffer，可以提高成绩。

PaParaZz1 · 2022-11-09T03:22:04Z

明白了，所以其实你的需求更简单，只需要自动定期存储replay buffer中的数据，且能够在重新训练的时候加载进来就可以了对吧

jaried · 2022-11-09T03:23:46Z

是的，很简单。只要能把replay buffer分文件保存和读取就行了，保存h5时使用zip算法压缩。

PaParaZz1 · 2022-11-21T04:52:40Z

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

如何存储和读取replay buffer为h5文件 #529

如何存储和读取replay buffer为h5文件 #529

jaried commented Oct 31, 2022 •

edited

Loading

PaParaZz1 commented Oct 31, 2022 •

edited

Loading

jaried commented Oct 31, 2022 •

edited

Loading

PaParaZz1 commented Nov 8, 2022

jaried commented Nov 9, 2022 •

edited

Loading

PaParaZz1 commented Nov 9, 2022

jaried commented Nov 9, 2022 •

edited

Loading

PaParaZz1 commented Nov 21, 2022

如何存储和读取replay buffer为h5文件 #529

如何存储和读取replay buffer为h5文件 #529

Comments

jaried commented Oct 31, 2022 • edited Loading

PaParaZz1 commented Oct 31, 2022 • edited Loading

jaried commented Oct 31, 2022 • edited Loading

PaParaZz1 commented Nov 8, 2022

jaried commented Nov 9, 2022 • edited Loading

PaParaZz1 commented Nov 9, 2022

jaried commented Nov 9, 2022 • edited Loading

PaParaZz1 commented Nov 21, 2022

jaried commented Oct 31, 2022 •

edited

Loading

PaParaZz1 commented Oct 31, 2022 •

edited

Loading

jaried commented Oct 31, 2022 •

edited

Loading

jaried commented Nov 9, 2022 •

edited

Loading

jaried commented Nov 9, 2022 •

edited

Loading