[do not merge] Random utils fixes #194

Workflow file for this run

.github/workflows/regression_tests.yml at 6fd50e7

	name: Containerized Regression Tests

	on:
	pull_request:
	branches:
	- 'main'

	jobs:
	build_and_push_jax_docker_image:
	runs-on: self-hosted
	steps:
	- uses: actions/checkout@v2
	- name: Build and push docker images
	run: \|
	GIT_BRANCH=${{ github.head_ref \|\| github.ref_name }}
	FRAMEWORK=jax
	IMAGE_NAME="algoperf_${FRAMEWORK}_${GIT_BRANCH}"
	cd $HOME/algorithmic-efficiency/docker
	docker build --no-cache -t $IMAGE_NAME . --build-arg framework=$FRAMEWORK --build-arg branch=$GIT_BRANCH
	BUILD_RETURN=$?
	if [[ ${BUILD_RETURN} != 0 ]]; then exit ${BUILD_RETURN}; fi
	docker tag $IMAGE_NAME us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/$IMAGE_NAME
	docker push us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/$IMAGE_NAME
	build_and_push_pytorch_docker_image:
	runs-on: self-hosted
	steps:
	- uses: actions/checkout@v2
	- name: Build and push docker images
	run: \|
	GIT_BRANCH=${{ github.head_ref \|\| github.ref_name }}
	FRAMEWORK=pytorch
	IMAGE_NAME="algoperf_${FRAMEWORK}_${GIT_BRANCH}"
	cd $HOME/algorithmic-efficiency/docker
	docker build --no-cache -t $IMAGE_NAME . --build-arg framework=$FRAMEWORK --build-arg branch=$GIT_BRANCH
	BUILD_RETURN=$?
	if [[ ${BUILD_RETURN} != 0 ]]; then exit ${BUILD_RETURN}; fi
	docker tag $IMAGE_NAME us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/$IMAGE_NAME
	docker push us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/$IMAGE_NAME
	fastmri_jax:
	runs-on: self-hosted
	needs: build_and_push_jax_docker_image
	steps:
	- uses: actions/checkout@v2
	- name: Run containerized workload
	run: \|
	docker pull us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_jax_${{ github.head_ref \|\| github.ref_name }}
	docker run -v $HOME/data/:/data/ -v $HOME/experiment_runs/:/experiment_runs -v $HOME/experiment_runs/logs:/logs --gpus all --ipc=host us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_jax_${{ github.head_ref \|\| github.ref_name }} -d fastmri -f jax -s reference_algorithms/paper_baselines/adamw/jax/submission.py -w fastmri -t reference_algorithms/paper_baselines/adamw/tuning_search_space.json -e tests/regression_tests/adamw -m 10 -c False -o True -r false
	imagenet_resnet_jax:
	runs-on: self-hosted
	needs: build_and_push_jax_docker_image
	steps:
	- uses: actions/checkout@v2
	- name: Run containerized workload
	run: \|
	docker pull us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_jax_${{ github.head_ref \|\| github.ref_name }}
	docker run -v $HOME/data/:/data/ -v $HOME/experiment_runs/:/experiment_runs -v $HOME/experiment_runs/logs:/logs --gpus all --ipc=host us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_jax_${{ github.head_ref \|\| github.ref_name }} -d imagenet -f jax -s reference_algorithms/paper_baselines/adamw/jax/submission.py -w imagenet_resnet -t reference_algorithms/paper_baselines/adamw/tuning_search_space.json -e tests/regression_tests/adamw -m 10 -c False -o True -r false
	imagenet_vit_jax:
	runs-on: self-hosted
	needs: build_and_push_jax_docker_image
	steps:
	- uses: actions/checkout@v2
	- name: Run containerized workload
	run: \|
	docker pull us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_jax_${{ github.head_ref \|\| github.ref_name }}
	docker run -v $HOME/data/:/data/ -v $HOME/experiment_runs/:/experiment_runs -v $HOME/experiment_runs/logs:/logs --gpus all --ipc=host us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_jax_${{ github.head_ref \|\| github.ref_name }} -d imagenet -f jax -s reference_algorithms/paper_baselines/adamw/jax/submission.py -w imagenet_vit -t reference_algorithms/paper_baselines/adamw/tuning_search_space.json -e tests/regression_tests/adamw -m 10 -c False -o True -r false
	ogbg_jax:
	runs-on: self-hosted
	needs: build_and_push_jax_docker_image
	steps:
	- uses: actions/checkout@v2
	- name: Run containerized workload
	run: \|
	docker pull us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_jax_${{ github.head_ref \|\| github.ref_name }}
	docker run -v $HOME/data/:/data/ -v $HOME/experiment_runs/:/experiment_runs -v $HOME/experiment_runs/logs:/logs --gpus all --ipc=host us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_jax_${{ github.head_ref \|\| github.ref_name }} -d ogbg -f jax -s reference_algorithms/paper_baselines/adamw/jax/submission.py -w ogbg -t reference_algorithms/paper_baselines/adamw/tuning_search_space.json -e tests/regression_tests/adamw -m 10 -c False -o True -r false
	criteo_jax:
	runs-on: self-hosted
	needs: build_and_push_jax_docker_image
	steps:
	- uses: actions/checkout@v2
	- name: Run containerized workload
	run: \|
	docker pull us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_jax_${{ github.head_ref \|\| github.ref_name }}
	docker run -v $HOME/data/:/data/ -v $HOME/experiment_runs/:/experiment_runs -v $HOME/experiment_runs/logs:/logs --gpus all --ipc=host us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_jax_${{ github.head_ref \|\| github.ref_name }} -d criteo1tb -f jax -s reference_algorithms/paper_baselines/adamw/jax/submission.py -w criteo1tb -t reference_algorithms/paper_baselines/adamw/tuning_search_space.json -e tests/regression_tests/adamw -m 10 -c False -o True -r false
	librispeech_conformer_jax:
	runs-on: self-hosted
	needs: build_and_push_jax_docker_image
	steps:
	- uses: actions/checkout@v2
	- name: Run containerized workload
	run: \|
	docker pull us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_jax_${{ github.head_ref \|\| github.ref_name }}
	docker run -v $HOME/data/:/data/ -v $HOME/experiment_runs/:/experiment_runs -v $HOME/experiment_runs/logs:/logs --gpus all --ipc=host us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_jax_${{ github.head_ref \|\| github.ref_name }} -d librispeech -f jax -s reference_algorithms/paper_baselines/adamw/jax/submission.py -w librispeech_conformer -t reference_algorithms/paper_baselines/adamw/tuning_search_space.json -e tests/regression_tests/adamw -m 10 -c False -o True -r false
	librispeech_deepspeech_jax:
	runs-on: self-hosted
	needs: build_and_push_jax_docker_image
	steps:
	- uses: actions/checkout@v2
	- name: Run containerized workload
	run: \|
	docker pull us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_jax_${{ github.head_ref \|\| github.ref_name }}
	docker run -v $HOME/data/:/data/ -v $HOME/experiment_runs/:/experiment_runs -v $HOME/experiment_runs/logs:/logs --gpus all --ipc=host us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_jax_${{ github.head_ref \|\| github.ref_name }} -d librispeech -f jax -s reference_algorithms/paper_baselines/adamw/jax/submission.py -w librispeech_deepspeech -t reference_algorithms/paper_baselines/adamw/tuning_search_space.json -e tests/regression_tests/adamw -m 10 -c False -o True -r false
	wmt_jax:
	runs-on: self-hosted
	needs: build_and_push_jax_docker_image
	steps:
	- uses: actions/checkout@v2
	- name: Run containerized workload
	run: \|
	docker pull us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_jax_${{ github.head_ref \|\| github.ref_name }}
	docker run -v $HOME/data/:/data/ -v $HOME/experiment_runs/:/experiment_runs -v $HOME/experiment_runs/logs:/logs --gpus all --ipc=host us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_jax_${{ github.head_ref \|\| github.ref_name }} -d wmt -f jax -s reference_algorithms/paper_baselines/adamw/jax/submission.py -w wmt -t reference_algorithms/paper_baselines/adamw/tuning_search_space.json -e tests/regression_tests/adamw -m 10 -c False -o True -r false
	fastmri_pytorch:
	runs-on: self-hosted
	needs: build_and_push_pytorch_docker_image
	steps:
	- uses: actions/checkout@v2
	- name: Run containerized workload
	run: \|
	docker pull us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_pytorch_${{ github.head_ref \|\| github.ref_name }}
	docker run -v $HOME/data/:/data/ -v $HOME/experiment_runs/:/experiment_runs -v $HOME/experiment_runs/logs:/logs --gpus all --ipc=host us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_pytorch_${{ github.head_ref \|\| github.ref_name }} -d fastmri -f pytorch -s reference_algorithms/paper_baselines/adamw/pytorch/submission.py -w fastmri -t reference_algorithms/paper_baselines/adamw/tuning_search_space.json -e tests/regression_tests/adamw -m 10 -c False -o True -r false
	imagenet_resnet_pytorch:
	runs-on: self-hosted
	needs: build_and_push_pytorch_docker_image
	steps:
	- uses: actions/checkout@v2
	- name: Run containerized workload
	run: \|
	docker pull us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_pytorch_${{ github.head_ref \|\| github.ref_name }}
	docker run -v $HOME/data/:/data/ -v $HOME/experiment_runs/:/experiment_runs -v $HOME/experiment_runs/logs:/logs --gpus all --ipc=host us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_pytorch_${{ github.head_ref \|\| github.ref_name }} -d imagenet -f pytorch -s reference_algorithms/paper_baselines/adamw/pytorch/submission.py -w imagenet_resnet -t reference_algorithms/paper_baselines/adamw/tuning_search_space.json -e tests/regression_tests/adamw -m 10 -c False -o True -r false
	imagenet_vit_pytorch:
	runs-on: self-hosted
	needs: build_and_push_pytorch_docker_image
	steps:
	- uses: actions/checkout@v2
	- name: Run containerized workload
	run: \|
	docker pull us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_pytorch_${{ github.head_ref \|\| github.ref_name }}
	docker run -v $HOME/data/:/data/ -v $HOME/experiment_runs/:/experiment_runs -v $HOME/experiment_runs/logs:/logs --gpus all --ipc=host us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_pytorch_${{ github.head_ref \|\| github.ref_name }} -d imagenet -f pytorch -s reference_algorithms/paper_baselines/adamw/pytorch/submission.py -w imagenet_vit -t reference_algorithms/paper_baselines/adamw/tuning_search_space.json -e tests/regression_tests/adamw -m 10 -c False -o True -r false
	ogbg_pytorch:
	runs-on: self-hosted
	needs: build_and_push_pytorch_docker_image
	steps:
	- uses: actions/checkout@v2
	- name: Run containerized workload
	run: \|
	docker pull us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_pytorch_${{ github.head_ref \|\| github.ref_name }}
	docker run -v $HOME/data/:/data/ -v $HOME/experiment_runs/:/experiment_runs -v $HOME/experiment_runs/logs:/logs --gpus all --ipc=host us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_pytorch_${{ github.head_ref \|\| github.ref_name }} -d ogbg -f pytorch -s reference_algorithms/paper_baselines/adamw/pytorch/submission.py -w ogbg -t reference_algorithms/paper_baselines/adamw/tuning_search_space.json -e tests/regression_tests/adamw -m 10 -c False -o True -r false
	criteo_pytorch:
	runs-on: self-hosted
	needs: build_and_push_pytorch_docker_image
	steps:
	- uses: actions/checkout@v2
	- name: Run containerized workload
	run: \|
	docker pull us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_pytorch_${{ github.head_ref \|\| github.ref_name }}
	docker run -v $HOME/data/:/data/ -v $HOME/experiment_runs/:/experiment_runs -v $HOME/experiment_runs/logs:/logs --gpus all --ipc=host us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_pytorch_${{ github.head_ref \|\| github.ref_name }} -d criteo1tb -f pytorch -s reference_algorithms/paper_baselines/adamw/pytorch/submission.py -w criteo1tb -t reference_algorithms/paper_baselines/adamw/tuning_search_space.json -e tests/regression_tests/adamw -m 10 -c False -o True -r false
	exit $?
	librispeech_conformer_pytorch:
	runs-on: self-hosted
	needs: build_and_push_pytorch_docker_image
	steps:
	- uses: actions/checkout@v2
	- name: Run containerized workload
	run: \|
	docker pull us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_pytorch_${{ github.head_ref \|\| github.ref_name }}
	docker run -v $HOME/data/:/data/ -v $HOME/experiment_runs/:/experiment_runs -v $HOME/experiment_runs/logs:/logs --gpus all --ipc=host us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_pytorch_${{ github.head_ref \|\| github.ref_name }} -d librispeech -f pytorch -s reference_algorithms/paper_baselines/adamw/pytorch/submission.py -w librispeech_conformer -t reference_algorithms/paper_baselines/adamw/tuning_search_space.json -e tests/regression_tests/adamw -m 10 -c False -o True -r false
	librispeech_deepspeech_pytorch:
	runs-on: self-hosted
	needs: build_and_push_pytorch_docker_image
	steps:
	- uses: actions/checkout@v2
	- name: Run containerized workload
	run: \|
	docker pull us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_pytorch_${{ github.head_ref \|\| github.ref_name }}
	docker run -v $HOME/data/:/data/ -v $HOME/experiment_runs/:/experiment_runs -v $HOME/experiment_runs/logs:/logs --gpus all --ipc=host us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_pytorch_${{ github.head_ref \|\| github.ref_name }} -d librispeech -f pytorch -s reference_algorithms/paper_baselines/adamw/pytorch/submission.py -w librispeech_deepspeech -t reference_algorithms/paper_baselines/adamw/tuning_search_space.json -e tests/regression_tests/adamw -m 10 -c False -o True -r false
	wmt_pytorch:
	runs-on: self-hosted
	needs: build_and_push_pytorch_docker_image
	steps:
	- uses: actions/checkout@v2
	- name: Run containerized workload
	run: \|
	docker pull us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_pytorch_${{ github.head_ref \|\| github.ref_name }}
	docker run -v $HOME/data/:/data/ -v $HOME/experiment_runs/:/experiment_runs -v $HOME/experiment_runs/logs:/logs --gpus all --ipc=host us-central1-docker.pkg.dev/training-algorithms-external/mlcommons-docker-repo/algoperf_pytorch_${{ github.head_ref \|\| github.ref_name }} -d wmt -f pytorch -s reference_algorithms/paper_baselines/adamw/pytorch/submission.py -w wmt -t reference_algorithms/paper_baselines/adamw/tuning_search_space.json -e tests/regression_tests/adamw -m 10 -c False -o True -r false

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[do not merge] Random utils fixes #194

Workflow file

[do not merge] Random utils fixes #194

Jobs

Run details

Workflow file for this run