Lightning-AI · SeanNaren · Nov 10, 2020 · Nov 9, 2020 · Nov 9, 2020 · Nov 9, 2020
@@ -136,6 +136,10 @@ def log(
         if sync_dist and isinstance(value, (torch.Tensor, numbers.Number)):
             value = sync_fn(value, group=sync_dist_group, reduce_op=sync_dist_op)
 
+        # no need to keep on gpu
+        if isinstance(value, torch.Tensor) and value.is_cuda:
+            value = value.cpu()
+
         if 'meta' not in self:
             self.__setitem__('meta', {})
 
@@ -395,6 +399,11 @@ def detach(self):
             if isinstance(v, torch.Tensor):
                 self.__setitem__(k, v.detach())
 
+    def cpu(self):
+        for k, v in self.items():
+            if isinstance(v, torch.Tensor):
+                self.__setitem__(k, v.cpu())
+
     def __repr__(self):
         self_copy = self.copy()
 

@@ -392,6 +392,9 @@ def cache_result(self) -> None:
             # attach capture batch_size
             Result.attach_batch_size(self._batch_size, hook_result)
 
+            hook_result.detach()
+            hook_result.cpu()
+
             self._internals[fx_name].append(
                 hook_result,
                 dataloader_idx=dataloader_idx,

@@ -426,6 +426,7 @@ def _process_training_step_output_1_0(self, training_step_output, split_batch):
         # track metrics without grads for epoch reduction
         training_step_output_for_epoch_end = copy(result)
         training_step_output_for_epoch_end.detach()
+        training_step_output_for_epoch_end.cpu()
 
         # what flows back into the system
         training_step_output = result

@@ -35,6 +35,7 @@ def recursive_detach(in_dict: dict) -> dict:
         if isinstance(v, dict):
             out_dict.update({k: recursive_detach(v)})
         elif callable(getattr(v, 'detach', None)):
+            # detach
             out_dict.update({k: v.detach()})
         else:
             out_dict.update({k: v})