calico-1226

Follow

Calico calico-1226

Follow

RL researcher

29 followers · 11 following

ZJU
Hangzhou, Zhejiang, China
22:51 (UTC +08:00)
jtd.acad@gmail.com

Achievements

Achievements

Organizations

Pinned Loading

PKU-Alignment/safe-rlhf PKU-Alignment/safe-rlhf Public

Safe RLHF: Constrained Value Alignment via Safe Reinforcement Learning from Human Feedback

Python 1.4k 119
PKU-Alignment/omnisafe PKU-Alignment/omnisafe Public

JMLR: OmniSafe is an infrastructural framework for accelerating SafeRL research.

Python 956 133
PKU-Alignment/beavertails PKU-Alignment/beavertails Public

BeaverTails is a collection of datasets designed to facilitate research on safety alignment in large language models (LLMs).

Makefile 117 5
PKU-Alignment/safe-sora PKU-Alignment/safe-sora Public

SafeSora is a human preference dataset designed to support safety alignment research in the text-to-video generation field, aiming to enhance the helpfulness and harmlessness of Large Vision Models…

Python 27 5