Group Center的核心项目,基于Spring Boot
的后端,支持GPU任务信息记录,以及消息推送。
- GPU信息记录
- WebHook消息推送
- 用户信息分发
- 配置文件分发
- SSH密钥上传与下载
- Kotlin
- Spring Boot
- MyBatis Plus
- MySQL
- Gradle
注意:需要配合group-center
使用
- 用户自定义消息推送
- SSH密钥备份与恢复
- Linux用户管理(需要服务器配置用户)
- 与
group-center
通信(用于二次开发)
- Python 3
- requests
注意:需要配合group-center
以及nvi-notify
使用
- 网址导航
- GPU看板
- GPU使用情况
- GPU任务情况
- 硬盘情况看板
- TypeScript
- React
- Ant Design
- Zustand
- UmiJS
- Axios
NVIDIA GPU服务器监控通知工具,主要用于监控NVIDIA GPU服务器的GPU使用情况,并通过企业微信(WeCom)进行通知。
支持CPU服务器(无GPU)以及NVIDIA GPU服务器。
支持通过group-center
/group-center-dashboard
/web-gpu-dashboard
拓展功能。
注意:本项目依赖于group-center-client
,requirements.txt
中已经给出具体版本需求。
- GPU使用情况监控
- GPU任务情况监控
- GPU信息推送至
group-center
- RESTful API
- Python 3
- flask
旧版GPU看板,主要支持查看多台服务器上的GPU状况,以及任务情况。
注意:需要配合nvi-notify
使用
- 查看GPU信息
- 查看GPU任务信息
- 查看内存信息
- TypeScript
- VUE3
- Element Plus
- Pinia
- Axios
- Java
- Kotlin
- Gradle(Kotlin DSL)
- Alibaba DragonWell JDK 21
- Jetbrains Intellij IDEA
- Jetbrains DataGrip
- PDManer
- Spring Boot
- Alibaba Druid
- MyBatis
- MyBatis Plus
- MySQL
- Alibaba OceanBase
- JWT(使用SM3算法自己实现的JWT)
- Tencent Kona Crypto(国密SM3/SM4算法)
- 企业微信(WeCom)
- 飞书(Lark)