pytorch · hwangjeff · Jun 2, 2022
@@ -103,6 +103,8 @@ def __len__(self):
 
 
 class LibriSpeechDataModule(LightningDataModule):
+    librispeech_cls = torchaudio.datasets.LIBRISPEECH
+
     def __init__(
         self,
         *,
@@ -116,6 +118,7 @@ def __init__(
         train_shuffle=True,
         num_workers=10,
     ):
+        super().__init__()
         self.librispeech_path = librispeech_path
         self.train_dataset_lengths = None
         self.val_dataset_lengths = None
@@ -130,9 +133,9 @@ def __init__(
 
     def train_dataloader(self):
         datasets = [
-            torchaudio.datasets.LIBRISPEECH(self.librispeech_path, url="train-clean-360"),
-            torchaudio.datasets.LIBRISPEECH(self.librispeech_path, url="train-clean-100"),
-            torchaudio.datasets.LIBRISPEECH(self.librispeech_path, url="train-other-500"),
+            self.librispeech_cls(self.librispeech_path, url="train-clean-360"),
+            self.librispeech_cls(self.librispeech_path, url="train-clean-100"),
+            self.librispeech_cls(self.librispeech_path, url="train-other-500"),
         ]
 
         if not self.train_dataset_lengths:
@@ -161,8 +164,8 @@ def train_dataloader(self):
 
     def val_dataloader(self):
         datasets = [
-            torchaudio.datasets.LIBRISPEECH(self.librispeech_path, url="dev-clean"),
-            torchaudio.datasets.LIBRISPEECH(self.librispeech_path, url="dev-other"),
+            self.librispeech_cls(self.librispeech_path, url="dev-clean"),
+            self.librispeech_cls(self.librispeech_path, url="dev-other"),
         ]
 
         if not self.val_dataset_lengths:
@@ -185,7 +188,7 @@ def val_dataloader(self):
         return dataloader
 
     def test_dataloader(self):
-        dataset = torchaudio.datasets.LIBRISPEECH(self.librispeech_path, url="test-clean")
+        dataset = self.librispeech_cls(self.librispeech_path, url="test-clean")
         dataset = TransformDataset(dataset, self.test_transform)
         dataloader = torch.utils.data.DataLoader(dataset, batch_size=None)
         return dataloader