example for using TorchInductor caching with torch.compile #2925

agunapal · 2024-02-02T20:04:55Z

Description

This PR shows 2 examples

Using the experimental feature TORCHINDUCTOR_FX_GRAPH_CACHE
Persisting torchinductor cache with a config

Fixes #(issue)

Type of change

Please delete options that are not relevant.

Bug fix (non-breaking change which fixes an issue)
Breaking change (fix or feature that would cause existing functionality to not work as expected)
New feature (non-breaking change which adds functionality)
This change requires a documentation update

Feature/Issue validation/testing

Please describe the Unit or Integration tests that you ran to verify your changes and relevant result summary. Provide instructions so it can be reproduced.
Please also list any relevant details for your test configuration.

Standalone testing of FX Graph Cache

Seeing a 40% reduction in compile time with resnet18 max-autotune

(ts_export_aot) ubuntu@ip-172-31-11-40:~/serve/examples/pt2/torch_inductor_caching$ rm -rf /tmp/torchinductor_ubuntu
(ts_export_aot) ubuntu@ip-172-31-11-40:~/serve/examples/pt2/torch_inductor_caching$ TORCHINDUCTOR_FX_GRAPH_CACHE=0 python resnet_compile.py 
/home/ubuntu/anaconda3/envs/ts_export_aot/lib/python3.10/site-packages/transformers/utils/generic.py:441: UserWarning: torch.utils._pytree._register_pytree_node is deprecated. Please use torch.utils._pytree.register_pytree_node instead.
  _torch_pytree._register_pytree_node(
AUTOTUNE convolution(1x3x224x224, 64x3x7x7)
  convolution 0.0317 ms 100.0%
  triton_convolution_4 0.0901 ms 35.2%
  triton_convolution_0 0.1004 ms 31.6%
  triton_convolution_5 0.1167 ms 27.2%
  triton_convolution_3 0.1249 ms 25.4%
  triton_convolution_2 0.2755 ms 11.5%
  triton_convolution_1 0.6390 ms 5.0%
SingleProcess AUTOTUNE takes 1.2819 seconds
AUTOTUNE convolution(1x64x56x56, 64x64x3x3)
  triton_convolution_10 0.0287 ms 100.0%
  triton_convolution_11 0.0287 ms 100.0%
  convolution 0.0328 ms 87.5%
  triton_convolution_6 0.0338 ms 84.8%
  triton_convolution_9 0.0389 ms 73.7%
  triton_convolution_12 0.0625 ms 45.9%
  triton_convolution_7 0.0707 ms 40.6%
  triton_convolution_8 0.1198 ms 23.9%
SingleProcess AUTOTUNE takes 0.9349 seconds
AUTOTUNE convolution(1x64x56x56, 128x64x3x3)
  triton_convolution_38 0.0287 ms 100.0%
  convolution 0.0328 ms 87.5%
  triton_convolution_39 0.0389 ms 73.7%
  triton_convolution_34 0.0430 ms 66.7%
  triton_convolution_37 0.0604 ms 47.5%
  triton_convolution_40 0.0625 ms 45.9%
  triton_convolution_35 0.0717 ms 40.0%
  triton_convolution_36 0.1300 ms 22.0%
SingleProcess AUTOTUNE takes 0.9305 seconds
AUTOTUNE convolution(1x128x28x28, 128x128x3x3)
  convolution 0.0430 ms 100.0%
  triton_convolution_45 0.0492 ms 87.5%
  triton_convolution_46 0.0696 ms 61.8%
  triton_convolution_41 0.0788 ms 54.5%
  triton_convolution_44 0.1116 ms 38.5%
  triton_convolution_47 0.1147 ms 37.5%
  triton_convolution_42 0.1321 ms 32.6%
  triton_convolution_43 0.2519 ms 17.1%
SingleProcess AUTOTUNE takes 0.9372 seconds
AUTOTUNE convolution(1x64x56x56, 128x64x1x1)
  triton_convolution_52 0.0082 ms 100.0%
  triton_convolution_53 0.0092 ms 88.9%
  triton_convolution_48 0.0102 ms 80.0%
  convolution 0.0123 ms 66.7%
  triton_convolution_51 0.0123 ms 66.7%
  triton_convolution_54 0.0133 ms 61.5%
  triton_convolution_49 0.0143 ms 57.1%
  triton_convolution_50 0.0195 ms 42.1%
SingleProcess AUTOTUNE takes 0.9277 seconds
AUTOTUNE convolution(1x128x28x28, 256x128x3x3)
  convolution 0.0348 ms 100.0%
  triton_convolution_73 0.0492 ms 70.8%
  triton_convolution_74 0.1116 ms 31.2%
  triton_convolution_72 0.1137 ms 30.6%
  triton_convolution_75 0.1157 ms 30.1%
  triton_convolution_70 0.1331 ms 26.2%
  triton_convolution_69 0.1362 ms 25.6%
  triton_convolution_71 0.1905 ms 18.3%
SingleProcess AUTOTUNE takes 0.9489 seconds
AUTOTUNE convolution(1x256x14x14, 256x256x3x3)
  convolution 0.0420 ms 100.0%
  triton_convolution_80 0.0911 ms 46.1%
  triton_convolution_78 0.1690 ms 24.8%
  triton_convolution_81 0.2150 ms 19.5%
  triton_convolution_79 0.2181 ms 19.2%
  triton_convolution_82 0.2222 ms 18.9%
  triton_convolution_77 0.2601 ms 16.1%
  triton_convolution_76 0.2621 ms 16.0%
SingleProcess AUTOTUNE takes 0.9564 seconds
AUTOTUNE convolution(1x128x28x28, 256x128x1x1)
  triton_convolution_87 0.0113 ms 100.0%
  convolution 0.0174 ms 64.7%
  triton_convolution_86 0.0184 ms 61.1%
  triton_convolution_88 0.0195 ms 57.9%
  triton_convolution_89 0.0195 ms 57.9%
  triton_convolution_83 0.0205 ms 55.0%
  triton_convolution_84 0.0205 ms 55.0%
  triton_convolution_85 0.0256 ms 44.0%
SingleProcess AUTOTUNE takes 0.9266 seconds
AUTOTUNE convolution(1x256x14x14, 512x256x3x3)
  convolution 0.0481 ms 100.0%
  triton_convolution_108 0.0942 ms 51.1%
  triton_convolution_106 0.1720 ms 28.0%
  triton_convolution_109 0.2171 ms 22.2%
  triton_convolution_110 0.2202 ms 21.9%
  triton_convolution_107 0.2212 ms 21.8%
  triton_convolution_105 0.2427 ms 19.8%
  triton_convolution_104 0.2662 ms 18.1%
SingleProcess AUTOTUNE takes 0.9539 seconds
AUTOTUNE convolution(1x512x7x7, 512x512x3x3)
  convolution 0.0788 ms 100.0%
  triton_convolution_117 0.1772 ms 44.5%
  triton_convolution_115 0.1812 ms 43.5%
  triton_convolution_113 0.1935 ms 40.7%
  triton_convolution_112 0.2273 ms 34.7%
  triton_convolution_114 0.2662 ms 29.6%
  triton_convolution_116 0.4301 ms 18.3%
  triton_convolution_111 0.5284 ms 14.9%
SingleProcess AUTOTUNE takes 0.9732 seconds
AUTOTUNE convolution(1x256x14x14, 512x256x1x1)
  triton_convolution_122 0.0154 ms 100.0%
  triton_convolution_120 0.0195 ms 78.9%
  convolution 0.0276 ms 55.6%
  triton_convolution_121 0.0307 ms 50.0%
  triton_convolution_124 0.0307 ms 50.0%
  triton_convolution_123 0.0317 ms 48.4%
  triton_convolution_119 0.0338 ms 45.5%
  triton_convolution_118 0.0348 ms 44.1%
SingleProcess AUTOTUNE takes 0.9263 seconds
AUTOTUNE addmm(1x1000, 1x512, 512x1000)
  triton_mm_143 0.0123 ms 100.0%
  triton_mm_145 0.0123 ms 100.0%
  triton_mm_147 0.0123 ms 100.0%
  triton_mm_141 0.0133 ms 92.3%
  triton_mm_142 0.0133 ms 92.3%
  addmm 0.0143 ms 85.7%
  triton_mm_140 0.0143 ms 85.7%
  triton_mm_144 0.0154 ms 80.0%
  triton_mm_148 0.0164 ms 75.0%
  bias_addmm 0.0174 ms 70.6%
SingleProcess AUTOTUNE takes 1.6142 seconds
Time taken for compile is 23943.22 ms
(ts_export_aot) ubuntu@ip-172-31-11-40:~/serve/examples/pt2/torch_inductor_caching$ TORCHINDUCTOR_FX_GRAPH_CACHE=0 python resnet_compile.py 
/home/ubuntu/anaconda3/envs/ts_export_aot/lib/python3.10/site-packages/transformers/utils/generic.py:441: UserWarning: torch.utils._pytree._register_pytree_node is deprecated. Please use torch.utils._pytree.register_pytree_node instead.
  _torch_pytree._register_pytree_node(
Time taken for compile is 5442.48 ms
(ts_export_aot) ubuntu@ip-172-31-11-40:~/serve/examples/pt2/torch_inductor_caching$ TORCHINDUCTOR_FX_GRAPH_CACHE=0 python resnet_compile.py 
/home/ubuntu/anaconda3/envs/ts_export_aot/lib/python3.10/site-packages/transformers/utils/generic.py:441: UserWarning: torch.utils._pytree._register_pytree_node is deprecated. Please use torch.utils._pytree.register_pytree_node instead.
  _torch_pytree._register_pytree_node(
Time taken for compile is 5422.06 ms
(ts_export_aot) ubuntu@ip-172-31-11-40:~/serve/examples/pt2/torch_inductor_caching$ TORCHINDUCTOR_FX_GRAPH_CACHE=0 python resnet_compile.py 
/home/ubuntu/anaconda3/envs/ts_export_aot/lib/python3.10/site-packages/transformers/utils/generic.py:441: UserWarning: torch.utils._pytree._register_pytree_node is deprecated. Please use torch.utils._pytree.register_pytree_node instead.
  _torch_pytree._register_pytree_node(
Time taken for compile is 5431.86 ms
(ts_export_aot) ubuntu@ip-172-31-11-40:~/serve/examples/pt2/torch_inductor_caching$ 
(ts_export_aot) ubuntu@ip-172-31-11-40:~/serve/examples/pt2/torch_inductor_caching$ 
(ts_export_aot) ubuntu@ip-172-31-11-40:~/serve/examples/pt2/torch_inductor_caching$ rm -rf /tmp/torchinductor_ubuntu/
(ts_export_aot) ubuntu@ip-172-31-11-40:~/serve/examples/pt2/torch_inductor_caching$ TORCHINDUCTOR_FX_GRAPH_CACHE=1 python resnet_compile.py 
/home/ubuntu/anaconda3/envs/ts_export_aot/lib/python3.10/site-packages/transformers/utils/generic.py:441: UserWarning: torch.utils._pytree._register_pytree_node is deprecated. Please use torch.utils._pytree.register_pytree_node instead.
  _torch_pytree._register_pytree_node(
AUTOTUNE convolution(1x3x224x224, 64x3x7x7)
  convolution 0.0317 ms 100.0%
  triton_convolution_4 0.0901 ms 35.2%
  triton_convolution_0 0.1004 ms 31.6%
  triton_convolution_5 0.1167 ms 27.2%
  triton_convolution_3 0.1249 ms 25.4%
  triton_convolution_2 0.2755 ms 11.5%
  triton_convolution_1 0.6390 ms 5.0%
SingleProcess AUTOTUNE takes 1.2805 seconds
AUTOTUNE convolution(1x64x56x56, 64x64x3x3)
  triton_convolution_10 0.0287 ms 100.0%
  triton_convolution_11 0.0287 ms 100.0%
  convolution 0.0317 ms 90.3%
  triton_convolution_6 0.0338 ms 84.8%
  triton_convolution_9 0.0389 ms 73.7%
  triton_convolution_12 0.0625 ms 45.9%
  triton_convolution_7 0.0707 ms 40.6%
  triton_convolution_8 0.1198 ms 23.9%
SingleProcess AUTOTUNE takes 0.9349 seconds
AUTOTUNE convolution(1x64x56x56, 128x64x3x3)
  triton_convolution_38 0.0287 ms 100.0%
  convolution 0.0328 ms 87.5%
  triton_convolution_39 0.0389 ms 73.7%
  triton_convolution_34 0.0440 ms 65.1%
  triton_convolution_37 0.0614 ms 46.7%
  triton_convolution_40 0.0614 ms 46.7%
  triton_convolution_35 0.0717 ms 40.0%
  triton_convolution_36 0.1300 ms 22.0%
SingleProcess AUTOTUNE takes 0.9290 seconds
AUTOTUNE convolution(1x128x28x28, 128x128x3x3)
  convolution 0.0430 ms 100.0%
  triton_convolution_45 0.0481 ms 89.4%
  triton_convolution_46 0.0686 ms 62.7%
  triton_convolution_41 0.0778 ms 55.3%
  triton_convolution_44 0.1126 ms 38.2%
  triton_convolution_47 0.1157 ms 37.2%
  triton_convolution_42 0.1311 ms 32.8%
  triton_convolution_43 0.2519 ms 17.1%
SingleProcess AUTOTUNE takes 0.9383 seconds
AUTOTUNE convolution(1x64x56x56, 128x64x1x1)
  triton_convolution_52 0.0082 ms 100.0%
  triton_convolution_48 0.0102 ms 80.0%
  triton_convolution_53 0.0102 ms 80.0%
  convolution 0.0123 ms 66.7%
  triton_convolution_51 0.0133 ms 61.5%
  triton_convolution_54 0.0133 ms 61.5%
  triton_convolution_49 0.0143 ms 57.1%
  triton_convolution_50 0.0195 ms 42.1%
SingleProcess AUTOTUNE takes 0.9287 seconds
AUTOTUNE convolution(1x128x28x28, 256x128x3x3)
  convolution 0.0358 ms 100.0%
  triton_convolution_73 0.0492 ms 72.9%
  triton_convolution_74 0.1106 ms 32.4%
  triton_convolution_72 0.1126 ms 31.8%
  triton_convolution_75 0.1157 ms 31.0%
  triton_convolution_70 0.1331 ms 26.9%
  triton_convolution_69 0.1362 ms 26.3%
  triton_convolution_71 0.1905 ms 18.8%
SingleProcess AUTOTUNE takes 0.9508 seconds
AUTOTUNE convolution(1x256x14x14, 256x256x3x3)
  convolution 0.0420 ms 100.0%
  triton_convolution_80 0.0911 ms 46.1%
  triton_convolution_78 0.1690 ms 24.8%
  triton_convolution_81 0.2150 ms 19.5%
  triton_convolution_79 0.2171 ms 19.3%
  triton_convolution_82 0.2222 ms 18.9%
  triton_convolution_77 0.2601 ms 16.1%
  triton_convolution_76 0.2621 ms 16.0%
SingleProcess AUTOTUNE takes 0.9560 seconds
AUTOTUNE convolution(1x128x28x28, 256x128x1x1)
  triton_convolution_87 0.0102 ms 100.0%
  convolution 0.0174 ms 58.8%
  triton_convolution_86 0.0184 ms 55.6%
  triton_convolution_88 0.0184 ms 55.6%
  triton_convolution_89 0.0195 ms 52.6%
  triton_convolution_83 0.0205 ms 50.0%
  triton_convolution_84 0.0205 ms 50.0%
  triton_convolution_85 0.0246 ms 41.7%
SingleProcess AUTOTUNE takes 0.9274 seconds
AUTOTUNE convolution(1x256x14x14, 512x256x3x3)
  convolution 0.0481 ms 100.0%
  triton_convolution_108 0.0942 ms 51.1%
  triton_convolution_106 0.1720 ms 28.0%
  triton_convolution_109 0.2171 ms 22.2%
  triton_convolution_110 0.2202 ms 21.9%
  triton_convolution_107 0.2212 ms 21.8%
  triton_convolution_105 0.2437 ms 19.7%
  triton_convolution_104 0.2662 ms 18.1%
SingleProcess AUTOTUNE takes 0.9534 seconds
AUTOTUNE convolution(1x512x7x7, 512x512x3x3)
  convolution 0.0788 ms 100.0%
  triton_convolution_117 0.1772 ms 44.5%
  triton_convolution_115 0.1802 ms 43.7%
  triton_convolution_113 0.1935 ms 40.7%
  triton_convolution_112 0.2263 ms 34.8%
  triton_convolution_114 0.2662 ms 29.6%
  triton_convolution_116 0.4291 ms 18.4%
  triton_convolution_111 0.5284 ms 14.9%
SingleProcess AUTOTUNE takes 0.9733 seconds
AUTOTUNE convolution(1x256x14x14, 512x256x1x1)
  triton_convolution_122 0.0154 ms 100.0%
  triton_convolution_120 0.0195 ms 78.9%
  convolution 0.0276 ms 55.6%
  triton_convolution_121 0.0297 ms 51.7%
  triton_convolution_124 0.0307 ms 50.0%
  triton_convolution_123 0.0317 ms 48.4%
  triton_convolution_118 0.0348 ms 44.1%
  triton_convolution_119 0.0348 ms 44.1%
SingleProcess AUTOTUNE takes 0.9280 seconds
AUTOTUNE addmm(1x1000, 1x512, 512x1000)
  triton_mm_143 0.0123 ms 100.0%
  triton_mm_145 0.0123 ms 100.0%
  triton_mm_147 0.0123 ms 100.0%
  triton_mm_141 0.0133 ms 92.3%
  triton_mm_142 0.0133 ms 92.3%
  addmm 0.0143 ms 85.7%
  triton_mm_140 0.0143 ms 85.7%
  triton_mm_144 0.0154 ms 80.0%
  triton_mm_148 0.0154 ms 80.0%
  bias_addmm 0.0174 ms 70.6%
SingleProcess AUTOTUNE takes 1.6174 seconds
Time taken for compile is 23931.91 ms
(ts_export_aot) ubuntu@ip-172-31-11-40:~/serve/examples/pt2/torch_inductor_caching$ TORCHINDUCTOR_FX_GRAPH_CACHE=1 python resnet_compile.py 
/home/ubuntu/anaconda3/envs/ts_export_aot/lib/python3.10/site-packages/transformers/utils/generic.py:441: UserWarning: torch.utils._pytree._register_pytree_node is deprecated. Please use torch.utils._pytree.register_pytree_node instead.
  _torch_pytree._register_pytree_node(
Time taken for compile is 3217.91 ms
(ts_export_aot) ubuntu@ip-172-31-11-40:~/serve/examples/pt2/torch_inductor_caching$ TORCHINDUCTOR_FX_GRAPH_CACHE=1 python resnet_compile.py 
/home/ubuntu/anaconda3/envs/ts_export_aot/lib/python3.10/site-packages/transformers/utils/generic.py:441: UserWarning: torch.utils._pytree._register_pytree_node is deprecated. Please use torch.utils._pytree.register_pytree_node instead.
  _torch_pytree._register_pytree_node(
Time taken for compile is 3197.86 ms
(ts_export_aot) ubuntu@ip-172-31-11-40:~/serve/examples/pt2/torch_inductor_caching$ TORCHINDUCTOR_FX_GRAPH_CACHE=1 python resnet_compile.py 
/home/ubuntu/anaconda3/envs/ts_export_aot/lib/python3.10/site-packages/transformers/utils/generic.py:441: UserWarning: torch.utils._pytree._register_pytree_node is deprecated. Please use torch.utils._pytree.register_pytree_node instead.
  _torch_pytree._register_pytree_node(
Time taken for compile is 3194.44 ms

inference test a

curl http://127.0.0.1:8080/predictions/densenet161 -T ../../image_classifier/kitten.jpg

2024-02-02T20:30:36,673 [INFO ] W-9000-densenet161_1.0 TS_METRICS - WorkerThreadTime.Milliseconds:3.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1706905836
{
  "tabby": 0.4669490456581116,
  "tiger_cat": 0.4647379517555237,
  "Egyptian_cat": 0.06556321680545807,
  "lynx": 0.0012964900815859437,
  "plastic_bag": 0.00022773907403461635
}

Inference Test B

curl http://127.0.0.1:8080/predictions/densenet161 -T ../../image_classifier/kitten.jpg
2024-02-02T20:32:53,877 [INFO ] epollEventLoopGroup-3-1 TS_METRICS - ts_inference_requests_total.Count:1.0|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1706905973
2024-02-02T20:32:53,879 [DEBUG] W-9000-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Flushing req.cmd PREDICT repeats 1 to backend at: 1706905973879
2024-02-02T20:32:53,879 [INFO ] W-9000-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Looping backend response at: 1706905973879
2024-02-02T20:32:53,880 [INFO ] W-9000-densenet161_1.0-stdout MODEL_LOG - Backend received inference at: 1706905973
2024-02-02T20:33:34,804 [INFO ] W-9000-densenet161_1.0-stdout org.pytorch.serve.wlm.WorkerLifeCycle - result=[METRICS]HandlerTime.Milliseconds:40923.26|#ModelName:densenet161,Level:Model|#type:GAUGE|#hostname:ip-172-31-11-40,1706906014,5452312a-501f-437b-90eb-d8aec052ee23, pattern=[METRICS]
2024-02-02T20:33:34,805 [INFO ] W-9000-densenet161_1.0-stdout MODEL_METRICS - HandlerTime.ms:40923.26|#ModelName:densenet161,Level:Model|#hostname:ip-172-31-11-40,requestID:5452312a-501f-437b-90eb-d8aec052ee23,timestamp:1706906014
2024-02-02T20:33:34,805 [INFO ] W-9000-densenet161_1.0-stdout org.pytorch.serve.wlm.WorkerLifeCycle - result=[METRICS]PredictionTime.Milliseconds:40923.51|#ModelName:densenet161,Level:Model|#type:GAUGE|#hostname:ip-172-31-11-40,1706906014,5452312a-501f-437b-90eb-d8aec052ee23, pattern=[METRICS]
2024-02-02T20:33:34,805 [INFO ] W-9000-densenet161_1.0-stdout MODEL_METRICS - PredictionTime.ms:40923.51|#ModelName:densenet161,Level:Model|#hostname:ip-172-31-11-40,requestID:5452312a-501f-437b-90eb-d8aec052ee23,timestamp:1706906014
2024-02-02T20:33:34,806 [INFO ] W-9000-densenet161_1.0 ACCESS_LOG - /127.0.0.1:43006 "PUT /predictions/densenet161 HTTP/1.1" 200 40929
2024-02-02T20:33:34,806 [INFO ] W-9000-densenet161_1.0 TS_METRICS - Requests2XX.Count:1.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1706906014
2024-02-02T20:33:34,806 [INFO ] W-9000-densenet161_1.0 TS_METRICS - ts_inference_latency_microseconds.Microseconds:4.0926337522E7|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1706906014
2024-02-02T20:33:34,807 [INFO ] W-9000-densenet161_1.0 TS_METRICS - ts_queue_latency_microseconds.Microseconds:152.952|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1706906014
2024-02-02T20:33:34,807 [DEBUG] W-9000-densenet161_1.0 org.pytorch.serve.job.RestJob - Waiting time ns: 152952, Backend time ns: 40928021140
2024-02-02T20:33:34,807 [INFO ] W-9000-densenet161_1.0 TS_METRICS - QueueTime.Milliseconds:0.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1706906014
2024-02-02T20:33:34,807 [INFO ] W-9000-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Backend response time: 40926
2024-02-02T20:33:34,807 [INFO ] W-9000-densenet161_1.0 TS_METRICS - WorkerThreadTime.Milliseconds:2.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1706906014
{
  "tabby": 0.46724748611450195,
  "tiger_cat": 0.46427276730537415,
  "Egyptian_cat": 0.06571859121322632,
  "lynx": 0.0013012205017730594,
  "plastic_bag": 0.0002294664882356301
}

Multi working testing with FX Graph Cache

:1.0|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790129
2024-02-13T02:08:49,099 [DEBUG] W-9000-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Flushing req.cmd PREDICT repeats 1 to backend at: 1707790129098
2024-02-13T02:08:49,099 [INFO ] W-9000-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Looping backend response at: 1707790129099
2024-02-13T02:08:49,100 [INFO ] W-9000-densenet161_1.0-stdout MODEL_LOG - Backend received inference at: 1707790129
2024-02-13T02:09:05,044 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE convolution(1x3x224x224, 96x3x7x7)
2024-02-13T02:09:05,044 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   convolution 0.0410 ms 100.0%
2024-02-13T02:09:05,045 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_4 0.1157 ms 35.4%
2024-02-13T02:09:05,045 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_5 0.1290 ms 31.7%
2024-02-13T02:09:05,045 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_0 0.1352 ms 30.3%
2024-02-13T02:09:05,045 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_3 0.1894 ms 21.6%
2024-02-13T02:09:05,046 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_6 0.2181 ms 18.8%
2024-02-13T02:09:05,046 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_2 0.2744 ms 14.9%
2024-02-13T02:09:05,046 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_1 1.6824 ms 2.4%
2024-02-13T02:09:05,046 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 2.5963 seconds
2024-02-13T02:09:06,692 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(3136x96, 96x192)
2024-02-13T02:09:06,692 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_7 0.0123 ms 100.0%
2024-02-13T02:09:06,692 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_17 0.0123 ms 100.0%
2024-02-13T02:09:06,692 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0133 ms 92.3%
2024-02-13T02:09:06,693 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_9 0.0133 ms 92.3%
2024-02-13T02:09:06,693 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_11 0.0133 ms 92.3%
2024-02-13T02:09:06,693 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_18 0.0133 ms 92.3%
2024-02-13T02:09:06,693 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_12 0.0143 ms 85.7%
2024-02-13T02:09:06,693 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_13 0.0143 ms 85.7%
2024-02-13T02:09:06,693 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_8 0.0164 ms 75.0%
2024-02-13T02:09:06,694 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_15 0.0174 ms 70.6%
2024-02-13T02:09:06,694 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5091 seconds
2024-02-13T02:09:07,718 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE convolution(1x192x56x56, 48x192x3x3)
2024-02-13T02:09:07,718 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   convolution 0.0594 ms 100.0%
2024-02-13T02:09:07,719 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_24 0.0696 ms 85.3%
2024-02-13T02:09:07,719 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_23 0.0727 ms 81.7%
2024-02-13T02:09:07,719 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_19 0.0860 ms 69.0%
2024-02-13T02:09:07,719 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_22 0.1055 ms 56.3%
2024-02-13T02:09:07,719 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_25 0.1720 ms 34.5%
2024-02-13T02:09:07,720 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_20 0.1997 ms 29.7%
2024-02-13T02:09:07,720 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_21 0.3400 ms 17.5%
2024-02-13T02:09:07,720 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 0.9514 seconds
2024-02-13T02:09:09,322 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(3136x144, 144x192)
2024-02-13T02:09:09,322 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0143 ms 100.0%
2024-02-13T02:09:09,322 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_28 0.0154 ms 93.3%
2024-02-13T02:09:09,322 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_36 0.0154 ms 93.3%
2024-02-13T02:09:09,322 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_26 0.0164 ms 87.5%
2024-02-13T02:09:09,322 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_30 0.0164 ms 87.5%
2024-02-13T02:09:09,323 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_37 0.0164 ms 87.5%
2024-02-13T02:09:09,323 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_31 0.0174 ms 82.4%
2024-02-13T02:09:09,323 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_32 0.0174 ms 82.4%
2024-02-13T02:09:09,323 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_34 0.0205 ms 70.0%
2024-02-13T02:09:09,323 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_27 0.0215 ms 66.7%
2024-02-13T02:09:09,323 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5086 seconds
2024-02-13T02:09:10,959 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(3136x192, 192x192)
2024-02-13T02:09:10,959 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_47 0.0174 ms 100.0%
2024-02-13T02:09:10,959 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_55 0.0174 ms 100.0%
2024-02-13T02:09:10,959 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_45 0.0184 ms 94.4%
2024-02-13T02:09:10,960 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_49 0.0184 ms 94.4%
2024-02-13T02:09:10,960 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_56 0.0195 ms 89.5%
2024-02-13T02:09:10,960 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_50 0.0205 ms 85.0%
2024-02-13T02:09:10,960 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_51 0.0205 ms 85.0%
2024-02-13T02:09:10,961 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_53 0.0205 ms 85.0%
2024-02-13T02:09:10,961 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_46 0.0236 ms 73.9%
2024-02-13T02:09:10,961 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_54 0.0236 ms 73.9%
2024-02-13T02:09:10,961 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5097 seconds
2024-02-13T02:09:12,597 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(3136x240, 240x192)
2024-02-13T02:09:12,597 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_66 0.0195 ms 100.0%
2024-02-13T02:09:12,597 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_68 0.0205 ms 95.0%
2024-02-13T02:09:12,597 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_74 0.0205 ms 95.0%
2024-02-13T02:09:12,597 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_64 0.0214 ms 90.8%
2024-02-13T02:09:12,597 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_70 0.0215 ms 90.5%
2024-02-13T02:09:12,598 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_75 0.0215 ms 90.5%
2024-02-13T02:09:12,598 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_69 0.0225 ms 86.4%
2024-02-13T02:09:12,598 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_72 0.0246 ms 79.2%
2024-02-13T02:09:12,598 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_73 0.0246 ms 79.2%
2024-02-13T02:09:12,598 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0276 ms 70.4%
2024-02-13T02:09:12,598 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5107 seconds
2024-02-13T02:09:14,232 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(3136x288, 288x192)
2024-02-13T02:09:14,232 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_85 0.0215 ms 100.0%
2024-02-13T02:09:14,232 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_87 0.0215 ms 100.0%
2024-02-13T02:09:14,232 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_83 0.0225 ms 95.5%
2024-02-13T02:09:14,233 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_93 0.0236 ms 91.3%
2024-02-13T02:09:14,233 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_88 0.0246 ms 87.5%
2024-02-13T02:09:14,233 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_89 0.0246 ms 87.5%
2024-02-13T02:09:14,233 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_94 0.0246 ms 87.5%
2024-02-13T02:09:14,233 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_91 0.0266 ms 80.8%
2024-02-13T02:09:14,233 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0317 ms 67.7%
2024-02-13T02:09:14,233 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_84 0.0317 ms 67.7%
2024-02-13T02:09:14,234 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5098 seconds
2024-02-13T02:09:15,869 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(3136x336, 336x192)
2024-02-13T02:09:15,870 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_106 0.0236 ms 100.0%
2024-02-13T02:09:15,870 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_102 0.0246 ms 95.8%
2024-02-13T02:09:15,870 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_104 0.0256 ms 92.0%
2024-02-13T02:09:15,870 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_112 0.0266 ms 88.5%
2024-02-13T02:09:15,870 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_113 0.0266 ms 88.5%
2024-02-13T02:09:15,871 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_107 0.0276 ms 85.2%
2024-02-13T02:09:15,871 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_108 0.0276 ms 85.2%
2024-02-13T02:09:15,871 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_110 0.0297 ms 79.3%
2024-02-13T02:09:15,871 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_111 0.0338 ms 69.7%
2024-02-13T02:09:15,871 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0348 ms 67.6%
2024-02-13T02:09:15,871 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5113 seconds
2024-02-13T02:09:17,507 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(3136x384, 384x192)
2024-02-13T02:09:17,508 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_125 0.0246 ms 100.0%
2024-02-13T02:09:17,508 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_123 0.0256 ms 96.0%
2024-02-13T02:09:17,508 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_121 0.0266 ms 92.3%
2024-02-13T02:09:17,508 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_127 0.0287 ms 85.7%
2024-02-13T02:09:17,508 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_131 0.0287 ms 85.7%
2024-02-13T02:09:17,508 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_126 0.0297 ms 82.8%
2024-02-13T02:09:17,508 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_129 0.0297 ms 82.8%
2024-02-13T02:09:17,508 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_132 0.0307 ms 80.0%
2024-02-13T02:09:17,509 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_130 0.0369 ms 66.7%
2024-02-13T02:09:17,509 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0379 ms 64.9%
2024-02-13T02:09:17,509 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5087 seconds
2024-02-13T02:09:19,123 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(784x192, 192x192)
2024-02-13T02:09:19,123 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_138 0.0092 ms 100.0%
2024-02-13T02:09:19,123 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_139 0.0092 ms 100.0%
2024-02-13T02:09:19,123 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0113 ms 81.8%
2024-02-13T02:09:19,123 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_142 0.0113 ms 81.8%
2024-02-13T02:09:19,123 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_141 0.0123 ms 75.0%
2024-02-13T02:09:19,123 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_133 0.0133 ms 69.2%
2024-02-13T02:09:19,124 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_134 0.0143 ms 64.3%
2024-02-13T02:09:19,124 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_136 0.0143 ms 64.3%
2024-02-13T02:09:19,124 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_144 0.0143 ms 64.3%
2024-02-13T02:09:19,124 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_135 0.0154 ms 60.0%
2024-02-13T02:09:19,124 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5095 seconds
2024-02-13T02:09:20,145 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE convolution(1x192x28x28, 48x192x3x3)
2024-02-13T02:09:20,146 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   convolution 0.0379 ms 100.0%
2024-02-13T02:09:20,146 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_150 0.0655 ms 57.8%
2024-02-13T02:09:20,146 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_149 0.0696 ms 54.4%
2024-02-13T02:09:20,146 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_145 0.0840 ms 45.1%
2024-02-13T02:09:20,146 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_148 0.1004 ms 37.8%
2024-02-13T02:09:20,146 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_151 0.1700 ms 22.3%
2024-02-13T02:09:20,147 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_146 0.1966 ms 19.3%
2024-02-13T02:09:20,147 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_147 0.3348 ms 11.3%
2024-02-13T02:09:20,147 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 0.9487 seconds
2024-02-13T02:09:21,751 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(784x240, 240x192)
2024-02-13T02:09:21,751 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_157 0.0102 ms 100.0%
2024-02-13T02:09:21,752 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_158 0.0102 ms 100.0%
2024-02-13T02:09:21,752 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0123 ms 83.3%
2024-02-13T02:09:21,752 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_161 0.0123 ms 83.3%
2024-02-13T02:09:21,752 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_160 0.0133 ms 76.9%
2024-02-13T02:09:21,752 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_152 0.0154 ms 66.7%
2024-02-13T02:09:21,752 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_163 0.0164 ms 62.5%
2024-02-13T02:09:21,753 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_153 0.0174 ms 58.8%
2024-02-13T02:09:21,753 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_154 0.0174 ms 58.8%
2024-02-13T02:09:21,753 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_162 0.0174 ms 58.8%
2024-02-13T02:09:21,753 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5084 seconds
2024-02-13T02:09:23,393 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(784x288, 288x192)
2024-02-13T02:09:23,393 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_176 0.0102 ms 100.0%
2024-02-13T02:09:23,393 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_177 0.0113 ms 90.9%
2024-02-13T02:09:23,393 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0133 ms 76.9%
2024-02-13T02:09:23,394 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_180 0.0133 ms 76.9%
2024-02-13T02:09:23,394 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_179 0.0143 ms 71.4%
2024-02-13T02:09:23,394 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_171 0.0184 ms 55.6%
2024-02-13T02:09:23,394 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_172 0.0184 ms 55.6%
2024-02-13T02:09:23,394 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_182 0.0184 ms 55.6%
2024-02-13T02:09:23,394 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_173 0.0195 ms 52.6%
2024-02-13T02:09:23,394 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_174 0.0195 ms 52.6%
2024-02-13T02:09:23,395 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5117 seconds
2024-02-13T02:09:25,030 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(784x336, 336x192)
2024-02-13T02:09:25,030 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_195 0.0123 ms 100.0%
2024-02-13T02:09:25,030 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_196 0.0123 ms 100.0%
2024-02-13T02:09:25,030 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0143 ms 85.7%
2024-02-13T02:09:25,030 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_199 0.0143 ms 85.7%
2024-02-13T02:09:25,031 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_198 0.0164 ms 75.0%
2024-02-13T02:09:25,031 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_190 0.0195 ms 63.2%
2024-02-13T02:09:25,031 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_201 0.0215 ms 57.1%
2024-02-13T02:09:25,031 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_191 0.0225 ms 54.5%
2024-02-13T02:09:25,031 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_192 0.0225 ms 54.5%
2024-02-13T02:09:25,031 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_193 0.0225 ms 54.5%
2024-02-13T02:09:25,031 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5105 seconds
2024-02-13T02:09:26,668 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(784x384, 384x192)
2024-02-13T02:09:26,668 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_214 0.0123 ms 100.0%
2024-02-13T02:09:26,668 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_215 0.0123 ms 100.0%
2024-02-13T02:09:26,669 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_218 0.0143 ms 85.7%
2024-02-13T02:09:26,669 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0154 ms 80.0%
2024-02-13T02:09:26,669 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_217 0.0164 ms 75.0%
2024-02-13T02:09:26,669 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_209 0.0195 ms 63.2%
2024-02-13T02:09:26,669 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_211 0.0225 ms 54.5%
2024-02-13T02:09:26,669 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_220 0.0225 ms 54.5%
2024-02-13T02:09:26,669 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_213 0.0236 ms 52.2%
2024-02-13T02:09:26,669 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_210 0.0236 ms 52.1%
2024-02-13T02:09:26,669 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5111 seconds
2024-02-13T02:09:28,305 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(784x432, 432x192)
2024-02-13T02:09:28,305 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_233 0.0133 ms 100.0%
2024-02-13T02:09:28,305 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_234 0.0133 ms 100.0%
2024-02-13T02:09:28,305 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0164 ms 81.2%
2024-02-13T02:09:28,305 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_237 0.0164 ms 81.2%
2024-02-13T02:09:28,306 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_236 0.0184 ms 72.2%
2024-02-13T02:09:28,306 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_228 0.0215 ms 61.9%
2024-02-13T02:09:28,306 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_231 0.0246 ms 54.2%
2024-02-13T02:09:28,306 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_232 0.0246 ms 54.2%
2024-02-13T02:09:28,306 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_229 0.0256 ms 52.0%
2024-02-13T02:09:28,306 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_239 0.0256 ms 52.0%
2024-02-13T02:09:28,306 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5099 seconds
2024-02-13T02:09:29,947 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(784x480, 480x192)
2024-02-13T02:09:29,947 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_252 0.0143 ms 100.0%
2024-02-13T02:09:29,947 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_253 0.0143 ms 100.0%
2024-02-13T02:09:29,948 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_256 0.0164 ms 87.5%
2024-02-13T02:09:29,948 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0174 ms 82.4%
2024-02-13T02:09:29,948 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_255 0.0184 ms 77.8%
2024-02-13T02:09:29,948 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_247 0.0256 ms 56.0%
2024-02-13T02:09:29,948 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_248 0.0256 ms 56.0%
2024-02-13T02:09:29,948 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_250 0.0256 ms 56.0%
2024-02-13T02:09:29,949 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_249 0.0266 ms 53.8%
2024-02-13T02:09:29,949 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_251 0.0276 ms 51.9%
2024-02-13T02:09:29,949 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5136 seconds
2024-02-13T02:09:30,227 [INFO ] pool-3-thread-1 TS_METRICS - CPUUtilization.Percent:50.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790170
2024-02-13T02:09:30,227 [INFO ] pool-3-thread-1 TS_METRICS - DiskAvailable.Gigabytes:31.923782348632812|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790170
2024-02-13T02:09:30,228 [INFO ] pool-3-thread-1 TS_METRICS - DiskUsage.Gigabytes:258.6271629333496|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790170
2024-02-13T02:09:30,228 [INFO ] pool-3-thread-1 TS_METRICS - DiskUtilization.Percent:89.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790170
2024-02-13T02:09:30,228 [INFO ] pool-3-thread-1 TS_METRICS - GPUMemoryUtilization.Percent:21.530310925829426|#Level:Host,DeviceId:0|#hostname:ip-172-31-11-40,timestamp:1707790170
2024-02-13T02:09:30,228 [INFO ] pool-3-thread-1 TS_METRICS - GPUMemoryUsed.Megabytes:4958.0|#Level:Host,DeviceId:0|#hostname:ip-172-31-11-40,timestamp:1707790170
2024-02-13T02:09:30,228 [INFO ] pool-3-thread-1 TS_METRICS - GPUUtilization.Percent:38.0|#Level:Host,DeviceId:0|#hostname:ip-172-31-11-40,timestamp:1707790170
2024-02-13T02:09:30,229 [INFO ] pool-3-thread-1 TS_METRICS - MemoryAvailable.Megabytes:16963.28125|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790170
2024-02-13T02:09:30,229 [INFO ] pool-3-thread-1 TS_METRICS - MemoryUsed.Megabytes:14260.12890625|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790170
2024-02-13T02:09:30,229 [INFO ] pool-3-thread-1 TS_METRICS - MemoryUtilization.Percent:46.5|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790170
2024-02-13T02:09:31,590 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(784x528, 528x192)
2024-02-13T02:09:31,591 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_271 0.0143 ms 100.0%
2024-02-13T02:09:31,591 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_272 0.0143 ms 100.0%
2024-02-13T02:09:31,591 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0184 ms 77.8%
2024-02-13T02:09:31,591 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_275 0.0184 ms 77.8%
2024-02-13T02:09:31,591 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_274 0.0205 ms 70.0%
2024-02-13T02:09:31,591 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_266 0.0256 ms 56.0%
2024-02-13T02:09:31,591 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_270 0.0276 ms 51.9%
2024-02-13T02:09:31,591 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_269 0.0287 ms 50.0%
2024-02-13T02:09:31,591 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_267 0.0297 ms 48.3%
2024-02-13T02:09:31,591 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_277 0.0297 ms 48.3%
2024-02-13T02:09:31,591 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5139 seconds
2024-02-13T02:09:33,227 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(784x576, 576x192)
2024-02-13T02:09:33,227 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_290 0.0143 ms 100.0%
2024-02-13T02:09:33,227 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_291 0.0154 ms 93.3%
2024-02-13T02:09:33,227 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0195 ms 73.7%
2024-02-13T02:09:33,227 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_294 0.0195 ms 73.7%
2024-02-13T02:09:33,227 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_293 0.0195 ms 73.4%
2024-02-13T02:09:33,227 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_285 0.0266 ms 53.8%
2024-02-13T02:09:33,227 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_286 0.0287 ms 50.0%
2024-02-13T02:09:33,228 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_287 0.0287 ms 50.0%
2024-02-13T02:09:33,228 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_288 0.0307 ms 46.7%
2024-02-13T02:09:33,228 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_289 0.0317 ms 45.2%
2024-02-13T02:09:33,228 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5112 seconds
2024-02-13T02:09:34,864 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(784x624, 624x192)
2024-02-13T02:09:34,864 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_309 0.0154 ms 100.0%
2024-02-13T02:09:34,864 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_310 0.0164 ms 93.7%
2024-02-13T02:09:34,864 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_313 0.0195 ms 78.9%
2024-02-13T02:09:34,864 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0205 ms 75.0%
2024-02-13T02:09:34,864 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_312 0.0215 ms 71.4%
2024-02-13T02:09:34,864 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_304 0.0287 ms 53.6%
2024-02-13T02:09:34,865 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_307 0.0317 ms 48.4%
2024-02-13T02:09:34,865 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_308 0.0317 ms 48.4%
2024-02-13T02:09:34,865 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_305 0.0338 ms 45.5%
2024-02-13T02:09:34,865 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_315 0.0338 ms 45.5%
2024-02-13T02:09:34,865 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5115 seconds
2024-02-13T02:09:36,504 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(784x672, 672x192)
2024-02-13T02:09:36,504 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_328 0.0164 ms 100.0%
2024-02-13T02:09:36,504 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_329 0.0164 ms 100.0%
2024-02-13T02:09:36,504 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0205 ms 80.0%
2024-02-13T02:09:36,504 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_332 0.0215 ms 76.2%
2024-02-13T02:09:36,504 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_331 0.0236 ms 69.6%
2024-02-13T02:09:36,505 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_325 0.0317 ms 51.6%
2024-02-13T02:09:36,505 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_323 0.0328 ms 50.0%
2024-02-13T02:09:36,505 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_324 0.0328 ms 50.0%
2024-02-13T02:09:36,505 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_326 0.0338 ms 48.5%
2024-02-13T02:09:36,505 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_334 0.0348 ms 47.1%
2024-02-13T02:09:36,505 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5113 seconds
2024-02-13T02:09:38,142 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(784x720, 720x192)
2024-02-13T02:09:38,142 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_347 0.0164 ms 100.0%
2024-02-13T02:09:38,142 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_348 0.0174 ms 94.3%
2024-02-13T02:09:38,142 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0215 ms 76.3%
2024-02-13T02:09:38,142 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_351 0.0215 ms 76.3%
2024-02-13T02:09:38,142 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_350 0.0246 ms 66.8%
2024-02-13T02:09:38,142 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_342 0.0317 ms 51.7%
2024-02-13T02:09:38,142 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_345 0.0348 ms 47.2%
2024-02-13T02:09:38,143 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_346 0.0348 ms 47.2%
2024-02-13T02:09:38,143 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_353 0.0369 ms 44.5%
2024-02-13T02:09:38,143 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_343 0.0379 ms 43.3%
2024-02-13T02:09:38,143 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5114 seconds
2024-02-13T02:09:39,781 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(784x768, 768x384)
2024-02-13T02:09:39,781 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_369 0.0246 ms 100.0%
2024-02-13T02:09:39,781 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_367 0.0266 ms 92.3%
2024-02-13T02:09:39,781 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_366 0.0276 ms 88.9%
2024-02-13T02:09:39,781 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0287 ms 85.7%
2024-02-13T02:09:39,781 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_361 0.0338 ms 72.7%
2024-02-13T02:09:39,781 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_363 0.0358 ms 68.6%
2024-02-13T02:09:39,781 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_364 0.0358 ms 68.6%
2024-02-13T02:09:39,781 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_365 0.0369 ms 66.7%
2024-02-13T02:09:39,782 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_362 0.0389 ms 63.2%
2024-02-13T02:09:39,782 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_370 0.0399 ms 61.5%
2024-02-13T02:09:39,782 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5121 seconds
2024-02-13T02:09:41,397 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x384, 384x192)
2024-02-13T02:09:41,398 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_378 0.0113 ms 100.0%
2024-02-13T02:09:41,398 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_379 0.0113 ms 100.0%
2024-02-13T02:09:41,398 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_382 0.0113 ms 100.0%
2024-02-13T02:09:41,398 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0123 ms 91.7%
2024-02-13T02:09:41,398 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_381 0.0154 ms 73.3%
2024-02-13T02:09:41,398 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_373 0.0195 ms 57.9%
2024-02-13T02:09:41,398 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_384 0.0215 ms 52.4%
2024-02-13T02:09:41,398 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_374 0.0236 ms 47.8%
2024-02-13T02:09:41,398 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_375 0.0236 ms 47.8%
2024-02-13T02:09:41,398 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_376 0.0236 ms 47.8%
2024-02-13T02:09:41,398 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5129 seconds
2024-02-13T02:09:42,413 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE convolution(1x192x14x14, 48x192x3x3)
2024-02-13T02:09:42,413 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   convolution 0.0328 ms 100.0%
2024-02-13T02:09:42,413 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_390 0.0676 ms 48.5%
2024-02-13T02:09:42,413 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_389 0.0696 ms 47.1%
2024-02-13T02:09:42,413 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_385 0.0829 ms 39.5%
2024-02-13T02:09:42,413 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_388 0.1004 ms 32.7%
2024-02-13T02:09:42,413 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_387 0.1280 ms 25.6%
2024-02-13T02:09:42,413 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_391 0.1690 ms 19.4%
2024-02-13T02:09:42,413 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_386 0.1956 ms 16.8%
2024-02-13T02:09:42,413 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 0.9412 seconds
2024-02-13T02:09:44,019 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x432, 432x192)
2024-02-13T02:09:44,020 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_397 0.0123 ms 100.0%
2024-02-13T02:09:44,020 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_398 0.0123 ms 100.0%
2024-02-13T02:09:44,020 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_401 0.0123 ms 100.0%
2024-02-13T02:09:44,020 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0133 ms 92.3%
2024-02-13T02:09:44,020 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_400 0.0164 ms 75.0%
2024-02-13T02:09:44,020 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_392 0.0215 ms 57.1%
2024-02-13T02:09:44,020 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_395 0.0236 ms 52.2%
2024-02-13T02:09:44,020 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_403 0.0236 ms 52.2%
2024-02-13T02:09:44,021 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_393 0.0246 ms 50.0%
2024-02-13T02:09:44,021 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_396 0.0246 ms 50.0%
2024-02-13T02:09:44,021 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5101 seconds
2024-02-13T02:09:45,660 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x480, 480x192)
2024-02-13T02:09:45,661 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_417 0.0123 ms 100.0%
2024-02-13T02:09:45,661 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_420 0.0123 ms 100.0%
2024-02-13T02:09:45,661 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0133 ms 92.3%
2024-02-13T02:09:45,661 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_416 0.0133 ms 92.3%
2024-02-13T02:09:45,661 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_419 0.0184 ms 66.7%
2024-02-13T02:09:45,661 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_411 0.0246 ms 50.0%
2024-02-13T02:09:45,661 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_412 0.0246 ms 50.0%
2024-02-13T02:09:45,661 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_414 0.0256 ms 48.0%
2024-02-13T02:09:45,661 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_422 0.0256 ms 48.0%
2024-02-13T02:09:45,661 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_413 0.0276 ms 44.4%
2024-02-13T02:09:45,661 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5124 seconds
2024-02-13T02:09:47,298 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x528, 528x192)
2024-02-13T02:09:47,298 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0133 ms 100.0%
2024-02-13T02:09:47,298 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_435 0.0133 ms 100.0%
2024-02-13T02:09:47,298 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_436 0.0133 ms 100.0%
2024-02-13T02:09:47,298 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_439 0.0133 ms 100.0%
2024-02-13T02:09:47,299 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_438 0.0195 ms 68.4%
2024-02-13T02:09:47,299 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_430 0.0246 ms 54.2%
2024-02-13T02:09:47,299 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_441 0.0266 ms 50.0%
2024-02-13T02:09:47,299 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_433 0.0276 ms 48.1%
2024-02-13T02:09:47,299 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_434 0.0276 ms 48.1%
2024-02-13T02:09:47,299 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_431 0.0287 ms 46.4%
2024-02-13T02:09:47,299 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5107 seconds
2024-02-13T02:09:48,938 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x576, 576x192)
2024-02-13T02:09:48,938 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_454 0.0133 ms 100.0%
2024-02-13T02:09:48,938 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0143 ms 92.9%
2024-02-13T02:09:48,938 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_455 0.0143 ms 92.9%
2024-02-13T02:09:48,938 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_458 0.0143 ms 92.9%
2024-02-13T02:09:48,938 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_457 0.0195 ms 68.4%
2024-02-13T02:09:48,938 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_449 0.0266 ms 50.0%
2024-02-13T02:09:48,938 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_450 0.0276 ms 48.1%
2024-02-13T02:09:48,938 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_451 0.0297 ms 44.8%
2024-02-13T02:09:48,938 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_452 0.0297 ms 44.8%
2024-02-13T02:09:48,938 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_460 0.0297 ms 44.8%
2024-02-13T02:09:48,938 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5117 seconds
2024-02-13T02:09:50,577 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x624, 624x192)
2024-02-13T02:09:50,577 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0143 ms 100.0%
2024-02-13T02:09:50,577 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_477 0.0143 ms 100.0%
2024-02-13T02:09:50,577 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_473 0.0154 ms 93.3%
2024-02-13T02:09:50,577 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_474 0.0154 ms 93.3%
2024-02-13T02:09:50,577 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_476 0.0215 ms 66.7%
2024-02-13T02:09:50,577 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_468 0.0276 ms 51.9%
2024-02-13T02:09:50,577 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_471 0.0307 ms 46.7%
2024-02-13T02:09:50,577 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_472 0.0317 ms 45.2%
2024-02-13T02:09:50,577 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_479 0.0317 ms 45.2%
2024-02-13T02:09:50,577 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_469 0.0338 ms 42.4%
2024-02-13T02:09:50,577 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5123 seconds
2024-02-13T02:09:52,216 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x672, 672x192)
2024-02-13T02:09:52,216 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0143 ms 100.0%
2024-02-13T02:09:52,216 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_492 0.0143 ms 100.0%
2024-02-13T02:09:52,216 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_493 0.0143 ms 100.0%
2024-02-13T02:09:52,216 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_496 0.0154 ms 93.3%
2024-02-13T02:09:52,216 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_495 0.0225 ms 63.6%
2024-02-13T02:09:52,217 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_487 0.0317 ms 45.2%
2024-02-13T02:09:52,217 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_488 0.0317 ms 45.2%
2024-02-13T02:09:52,217 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_491 0.0317 ms 45.2%
2024-02-13T02:09:52,217 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_489 0.0328 ms 43.8%
2024-02-13T02:09:52,217 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_498 0.0328 ms 43.8%
2024-02-13T02:09:52,217 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5111 seconds
2024-02-13T02:09:53,864 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x720, 720x192)
2024-02-13T02:09:53,865 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0143 ms 100.0%
2024-02-13T02:09:53,865 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_512 0.0154 ms 93.3%
2024-02-13T02:09:53,865 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_511 0.0163 ms 87.8%
2024-02-13T02:09:53,865 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_515 0.0164 ms 87.5%
2024-02-13T02:09:53,865 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_514 0.0246 ms 58.3%
2024-02-13T02:09:53,865 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_506 0.0317 ms 45.2%
2024-02-13T02:09:53,865 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_509 0.0348 ms 41.2%
2024-02-13T02:09:53,865 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_510 0.0348 ms 41.2%
2024-02-13T02:09:53,865 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_517 0.0358 ms 40.0%
2024-02-13T02:09:53,865 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_507 0.0369 ms 38.9%
2024-02-13T02:09:53,866 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5130 seconds
2024-02-13T02:09:55,500 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x768, 768x192)
2024-02-13T02:09:55,500 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0143 ms 100.0%
2024-02-13T02:09:55,500 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_530 0.0154 ms 93.3%
2024-02-13T02:09:55,500 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_531 0.0164 ms 87.5%
2024-02-13T02:09:55,501 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_534 0.0164 ms 87.5%
2024-02-13T02:09:55,501 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_533 0.0246 ms 58.3%
2024-02-13T02:09:55,501 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_525 0.0328 ms 43.8%
2024-02-13T02:09:55,501 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_528 0.0358 ms 40.0%
2024-02-13T02:09:55,501 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_529 0.0358 ms 40.0%
2024-02-13T02:09:55,501 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_527 0.0369 ms 38.9%
2024-02-13T02:09:55,501 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_526 0.0379 ms 37.8%
2024-02-13T02:09:55,501 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5107 seconds
2024-02-13T02:09:57,329 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x816, 816x192)
2024-02-13T02:09:57,329 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0154 ms 100.0%
2024-02-13T02:09:57,329 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_549 0.0164 ms 93.7%
2024-02-13T02:09:57,329 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_550 0.0164 ms 93.7%
2024-02-13T02:09:57,329 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_553 0.0174 ms 88.2%
2024-02-13T02:09:57,329 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_552 0.0256 ms 60.0%
2024-02-13T02:09:57,329 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_544 0.0348 ms 44.1%
2024-02-13T02:09:57,330 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_547 0.0379 ms 40.5%
2024-02-13T02:09:57,330 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_548 0.0379 ms 40.5%
2024-02-13T02:09:57,330 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_555 0.0389 ms 39.5%
2024-02-13T02:09:57,330 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_545 0.0410 ms 37.5%
2024-02-13T02:09:57,330 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5136 seconds
2024-02-13T02:09:58,969 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x864, 864x192)
2024-02-13T02:09:58,970 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0154 ms 100.0%
2024-02-13T02:09:58,970 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_568 0.0174 ms 88.2%
2024-02-13T02:09:58,970 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_572 0.0174 ms 88.2%
2024-02-13T02:09:58,970 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_569 0.0184 ms 83.3%
2024-02-13T02:09:58,970 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_571 0.0266 ms 57.7%
2024-02-13T02:09:58,970 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_574 0.0379 ms 40.5%
2024-02-13T02:09:58,970 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_563 0.0399 ms 38.5%
2024-02-13T02:09:58,970 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_564 0.0399 ms 38.5%
2024-02-13T02:09:58,970 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_566 0.0399 ms 38.5%
2024-02-13T02:09:58,970 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_567 0.0399 ms 38.5%
2024-02-13T02:09:58,970 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5128 seconds
2024-02-13T02:10:00,609 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x912, 912x192)
2024-02-13T02:10:00,609 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0154 ms 100.0%
2024-02-13T02:10:00,609 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_588 0.0174 ms 88.2%
2024-02-13T02:10:00,610 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_587 0.0184 ms 83.3%
2024-02-13T02:10:00,610 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_591 0.0195 ms 78.9%
2024-02-13T02:10:00,610 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_590 0.0297 ms 51.7%
2024-02-13T02:10:00,610 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_582 0.0389 ms 39.5%
2024-02-13T02:10:00,610 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_593 0.0389 ms 39.5%
2024-02-13T02:10:00,610 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_585 0.0420 ms 36.6%
2024-02-13T02:10:00,610 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_586 0.0420 ms 36.6%
2024-02-13T02:10:00,610 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_583 0.0451 ms 34.1%
2024-02-13T02:10:00,610 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5121 seconds
2024-02-13T02:10:02,254 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x960, 960x192)
2024-02-13T02:10:02,254 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0164 ms 100.0%
2024-02-13T02:10:02,254 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_606 0.0184 ms 88.9%
2024-02-13T02:10:02,254 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_607 0.0195 ms 84.2%
2024-02-13T02:10:02,254 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_610 0.0195 ms 84.2%
2024-02-13T02:10:02,254 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_609 0.0287 ms 57.1%
2024-02-13T02:10:02,254 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_601 0.0399 ms 41.0%
2024-02-13T02:10:02,254 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_612 0.0410 ms 40.0%
2024-02-13T02:10:02,254 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_602 0.0430 ms 38.1%
2024-02-13T02:10:02,254 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_604 0.0440 ms 37.2%
2024-02-13T02:10:02,254 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_605 0.0440 ms 37.2%
2024-02-13T02:10:02,255 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5144 seconds
2024-02-13T02:10:03,894 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x1008, 1008x192)
2024-02-13T02:10:03,894 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0195 ms 100.0%
2024-02-13T02:10:03,894 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_625 0.0195 ms 100.0%
2024-02-13T02:10:03,894 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_626 0.0195 ms 100.0%
2024-02-13T02:10:03,895 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_629 0.0195 ms 100.0%
2024-02-13T02:10:03,895 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_628 0.0307 ms 63.3%
2024-02-13T02:10:03,895 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_620 0.0420 ms 46.3%
2024-02-13T02:10:03,895 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_631 0.0430 ms 45.2%
2024-02-13T02:10:03,895 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_623 0.0461 ms 42.2%
2024-02-13T02:10:03,895 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_624 0.0461 ms 42.2%
2024-02-13T02:10:03,895 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_621 0.0492 ms 39.6%
2024-02-13T02:10:03,895 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5104 seconds
2024-02-13T02:10:05,537 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x1056, 1056x192)
2024-02-13T02:10:05,537 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0195 ms 100.0%
2024-02-13T02:10:05,537 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_644 0.0195 ms 100.0%
2024-02-13T02:10:05,537 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_645 0.0205 ms 95.0%
2024-02-13T02:10:05,537 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_648 0.0215 ms 90.5%
2024-02-13T02:10:05,537 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_647 0.0317 ms 61.3%
2024-02-13T02:10:05,537 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_650 0.0451 ms 43.2%
2024-02-13T02:10:05,537 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_640 0.0461 ms 42.2%
2024-02-13T02:10:05,537 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_639 0.0471 ms 41.3%
2024-02-13T02:10:05,538 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_642 0.0471 ms 41.3%
2024-02-13T02:10:05,538 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_643 0.0471 ms 41.3%
2024-02-13T02:10:05,538 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5138 seconds
2024-02-13T02:10:07,180 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x1104, 1104x192)
2024-02-13T02:10:07,180 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0204 ms 100.0%
2024-02-13T02:10:07,180 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_664 0.0205 ms 99.7%
2024-02-13T02:10:07,180 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_663 0.0215 ms 94.9%
2024-02-13T02:10:07,180 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_667 0.0215 ms 94.9%
2024-02-13T02:10:07,180 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_666 0.0338 ms 60.4%
2024-02-13T02:10:07,180 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_658 0.0451 ms 45.3%
2024-02-13T02:10:07,180 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_669 0.0461 ms 44.3%
2024-02-13T02:10:07,180 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_661 0.0492 ms 41.5%
2024-02-13T02:10:07,180 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_662 0.0492 ms 41.5%
2024-02-13T02:10:07,181 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_659 0.0532 ms 38.3%
2024-02-13T02:10:07,181 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5135 seconds
2024-02-13T02:10:08,822 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x1152, 1152x192)
2024-02-13T02:10:08,822 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_683 0.0205 ms 100.0%
2024-02-13T02:10:08,822 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0215 ms 95.2%
2024-02-13T02:10:08,822 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_682 0.0215 ms 95.2%
2024-02-13T02:10:08,822 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_686 0.0215 ms 95.2%
2024-02-13T02:10:08,822 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_685 0.0338 ms 60.6%
2024-02-13T02:10:08,823 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_677 0.0471 ms 43.5%
2024-02-13T02:10:08,823 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_688 0.0492 ms 41.7%
2024-02-13T02:10:08,823 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_680 0.0502 ms 40.8%
2024-02-13T02:10:08,823 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_681 0.0512 ms 40.0%
2024-02-13T02:10:08,823 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_679 0.0522 ms 39.2%
2024-02-13T02:10:08,823 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5124 seconds
2024-02-13T02:10:10,463 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x1200, 1200x192)
2024-02-13T02:10:10,464 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0205 ms 100.0%
2024-02-13T02:10:10,464 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_701 0.0225 ms 90.9%
2024-02-13T02:10:10,464 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_702 0.0225 ms 90.9%
2024-02-13T02:10:10,464 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_705 0.0225 ms 90.9%
2024-02-13T02:10:10,464 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_704 0.0358 ms 57.1%
2024-02-13T02:10:10,464 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_696 0.0492 ms 41.7%
2024-02-13T02:10:10,464 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_707 0.0502 ms 40.8%
2024-02-13T02:10:10,464 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_699 0.0532 ms 38.5%
2024-02-13T02:10:10,464 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_700 0.0532 ms 38.5%
2024-02-13T02:10:10,464 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_697 0.0573 ms 35.7%
2024-02-13T02:10:10,464 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5116 seconds
2024-02-13T02:10:12,114 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x1248, 1248x192)
2024-02-13T02:10:12,114 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0215 ms 100.0%
2024-02-13T02:10:12,114 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_721 0.0215 ms 100.0%
2024-02-13T02:10:12,114 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_720 0.0225 ms 95.5%
2024-02-13T02:10:12,114 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_724 0.0225 ms 95.5%
2024-02-13T02:10:12,114 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_723 0.0358 ms 60.0%
2024-02-13T02:10:12,114 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_726 0.0532 ms 40.4%
2024-02-13T02:10:12,114 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_716 0.0543 ms 39.6%
2024-02-13T02:10:12,114 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_718 0.0543 ms 39.6%
2024-02-13T02:10:12,114 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_719 0.0543 ms 39.6%
2024-02-13T02:10:12,114 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_715 0.0553 ms 38.9%
2024-02-13T02:10:12,115 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5168 seconds
2024-02-13T02:10:13,762 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x1296, 1296x192)
2024-02-13T02:10:13,762 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0215 ms 100.0%
2024-02-13T02:10:13,762 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_739 0.0236 ms 91.3%
2024-02-13T02:10:13,762 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_740 0.0236 ms 91.3%
2024-02-13T02:10:13,762 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_743 0.0246 ms 87.5%
2024-02-13T02:10:13,762 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_742 0.0389 ms 55.3%
2024-02-13T02:10:13,762 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_734 0.0522 ms 41.2%
2024-02-13T02:10:13,762 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_745 0.0532 ms 40.4%
2024-02-13T02:10:13,762 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_737 0.0563 ms 38.2%
2024-02-13T02:10:13,762 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_738 0.0563 ms 38.2%
2024-02-13T02:10:13,762 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_735 0.0614 ms 35.0%
2024-02-13T02:10:13,763 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5121 seconds
2024-02-13T02:10:15,408 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x1344, 1344x192)
2024-02-13T02:10:15,408 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0225 ms 100.0%
2024-02-13T02:10:15,408 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_759 0.0225 ms 100.0%
2024-02-13T02:10:15,408 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_758 0.0246 ms 91.7%
2024-02-13T02:10:15,408 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_762 0.0246 ms 91.7%
2024-02-13T02:10:15,408 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_761 0.0379 ms 59.5%
2024-02-13T02:10:15,408 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_753 0.0543 ms 41.5%
2024-02-13T02:10:15,408 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_764 0.0553 ms 40.7%
2024-02-13T02:10:15,408 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_754 0.0584 ms 38.6%
2024-02-13T02:10:15,408 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_756 0.0584 ms 38.6%
2024-02-13T02:10:15,408 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_757 0.0584 ms 38.6%
2024-02-13T02:10:15,408 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5115 seconds
2024-02-13T02:10:17,060 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x1392, 1392x192)
2024-02-13T02:10:17,061 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0225 ms 100.0%
2024-02-13T02:10:17,061 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_778 0.0246 ms 91.7%
2024-02-13T02:10:17,061 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_781 0.0246 ms 91.7%
2024-02-13T02:10:17,061 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_777 0.0256 ms 88.0%
2024-02-13T02:10:17,061 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_780 0.0399 ms 56.4%
2024-02-13T02:10:17,061 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_772 0.0553 ms 40.7%
2024-02-13T02:10:17,061 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_783 0.0573 ms 39.3%
2024-02-13T02:10:17,061 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_775 0.0604 ms 37.3%
2024-02-13T02:10:17,061 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_776 0.0604 ms 37.3%
2024-02-13T02:10:17,061 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_773 0.0655 ms 34.4%
2024-02-13T02:10:17,061 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5180 seconds
2024-02-13T02:10:18,710 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x1440, 1440x192)
2024-02-13T02:10:18,710 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0225 ms 100.0%
2024-02-13T02:10:18,710 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_797 0.0246 ms 91.7%
2024-02-13T02:10:18,710 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_796 0.0256 ms 88.0%
2024-02-13T02:10:18,710 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_800 0.0266 ms 84.6%
2024-02-13T02:10:18,710 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_799 0.0399 ms 56.4%
2024-02-13T02:10:18,710 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_802 0.0594 ms 37.9%
2024-02-13T02:10:18,710 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_794 0.0614 ms 36.7%
2024-02-13T02:10:18,710 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_791 0.0625 ms 36.1%
2024-02-13T02:10:18,710 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_792 0.0625 ms 36.1%
2024-02-13T02:10:18,710 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_795 0.0625 ms 36.1%
2024-02-13T02:10:18,710 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5150 seconds
2024-02-13T02:10:20,363 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x1488, 1488x192)
2024-02-13T02:10:20,363 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0236 ms 100.0%
2024-02-13T02:10:20,363 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_816 0.0256 ms 92.0%
2024-02-13T02:10:20,363 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_815 0.0266 ms 88.5%
2024-02-13T02:10:20,363 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_819 0.0266 ms 88.5%
2024-02-13T02:10:20,363 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_818 0.0430 ms 54.8%
2024-02-13T02:10:20,363 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_810 0.0584 ms 40.4%
2024-02-13T02:10:20,363 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_821 0.0604 ms 39.0%
2024-02-13T02:10:20,363 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_813 0.0635 ms 37.1%
2024-02-13T02:10:20,363 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_814 0.0635 ms 37.1%
2024-02-13T02:10:20,363 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_811 0.0696 ms 33.8%
2024-02-13T02:10:20,364 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5158 seconds
2024-02-13T02:10:22,010 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x1536, 1536x192)
2024-02-13T02:10:22,010 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0236 ms 100.0%
2024-02-13T02:10:22,010 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_835 0.0256 ms 92.0%
2024-02-13T02:10:22,010 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_834 0.0266 ms 88.5%
2024-02-13T02:10:22,010 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_838 0.0266 ms 88.5%
2024-02-13T02:10:22,010 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_837 0.0420 ms 56.1%
2024-02-13T02:10:22,010 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_829 0.0604 ms 39.0%
2024-02-13T02:10:22,010 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_840 0.0625 ms 37.7%
2024-02-13T02:10:22,011 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_832 0.0655 ms 35.9%
2024-02-13T02:10:22,011 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_833 0.0655 ms 35.9%
2024-02-13T02:10:22,011 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_831 0.0686 ms 34.3%
2024-02-13T02:10:22,011 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5131 seconds
2024-02-13T02:10:23,659 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x1584, 1584x192)
2024-02-13T02:10:23,659 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0236 ms 100.0%
2024-02-13T02:10:23,660 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_853 0.0276 ms 85.2%
2024-02-13T02:10:23,660 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_854 0.0276 ms 85.2%
2024-02-13T02:10:23,660 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_857 0.0276 ms 85.2%
2024-02-13T02:10:23,660 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_856 0.0440 ms 53.5%
2024-02-13T02:10:23,660 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_848 0.0614 ms 38.3%
2024-02-13T02:10:23,660 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_859 0.0650 ms 36.2%
2024-02-13T02:10:23,660 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_851 0.0676 ms 34.8%
2024-02-13T02:10:23,660 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_852 0.0676 ms 34.8%
2024-02-13T02:10:23,660 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_849 0.0727 ms 32.4%
2024-02-13T02:10:23,660 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5133 seconds
2024-02-13T02:10:25,310 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x1632, 1632x192)
2024-02-13T02:10:25,310 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0246 ms 100.0%
2024-02-13T02:10:25,310 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_873 0.0266 ms 92.3%
2024-02-13T02:10:25,310 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_872 0.0276 ms 88.9%
2024-02-13T02:10:25,311 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_876 0.0276 ms 88.9%
2024-02-13T02:10:25,311 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_875 0.0451 ms 54.5%
2024-02-13T02:10:25,311 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_878 0.0666 ms 36.9%
2024-02-13T02:10:25,311 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_868 0.0686 ms 35.8%
2024-02-13T02:10:25,311 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_870 0.0686 ms 35.8%
2024-02-13T02:10:25,311 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_867 0.0696 ms 35.3%
2024-02-13T02:10:25,311 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_871 0.0696 ms 35.3%
2024-02-13T02:10:25,311 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5142 seconds
2024-02-13T02:10:26,968 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x1680, 1680x192)
2024-02-13T02:10:26,969 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0246 ms 100.0%
2024-02-13T02:10:26,969 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_892 0.0287 ms 85.7%
2024-02-13T02:10:26,969 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_891 0.0297 ms 82.8%
2024-02-13T02:10:26,969 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_895 0.0297 ms 82.8%
2024-02-13T02:10:26,969 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_894 0.0471 ms 52.2%
2024-02-13T02:10:26,969 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_886 0.0655 ms 37.5%
2024-02-13T02:10:26,969 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_897 0.0676 ms 36.4%
2024-02-13T02:10:26,969 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_890 0.0707 ms 34.8%
2024-02-13T02:10:26,969 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_889 0.0717 ms 34.3%
2024-02-13T02:10:26,969 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_887 0.0778 ms 31.6%
2024-02-13T02:10:26,970 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5152 seconds
2024-02-13T02:10:28,622 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x1728, 1728x192)
2024-02-13T02:10:28,623 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0246 ms 100.0%
2024-02-13T02:10:28,623 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_911 0.0276 ms 88.9%
2024-02-13T02:10:28,623 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_910 0.0297 ms 82.8%
2024-02-13T02:10:28,623 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_914 0.0297 ms 82.8%
2024-02-13T02:10:28,623 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_913 0.0461 ms 53.3%
2024-02-13T02:10:28,623 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_905 0.0676 ms 36.4%
2024-02-13T02:10:28,623 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_916 0.0686 ms 35.8%
2024-02-13T02:10:28,623 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_908 0.0717 ms 34.3%
2024-02-13T02:10:28,623 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_909 0.0717 ms 34.3%
2024-02-13T02:10:28,623 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_906 0.0727 ms 33.8%
2024-02-13T02:10:28,623 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5161 seconds
2024-02-13T02:10:30,155 [INFO ] pool-3-thread-1 TS_METRICS - CPUUtilization.Percent:50.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790230
2024-02-13T02:10:30,155 [INFO ] pool-3-thread-1 TS_METRICS - DiskAvailable.Gigabytes:31.92081069946289|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790230
2024-02-13T02:10:30,155 [INFO ] pool-3-thread-1 TS_METRICS - DiskUsage.Gigabytes:258.63013458251953|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790230
2024-02-13T02:10:30,155 [INFO ] pool-3-thread-1 TS_METRICS - DiskUtilization.Percent:89.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790230
2024-02-13T02:10:30,156 [INFO ] pool-3-thread-1 TS_METRICS - GPUMemoryUtilization.Percent:21.547681083897864|#Level:Host,DeviceId:0|#hostname:ip-172-31-11-40,timestamp:1707790230
2024-02-13T02:10:30,156 [INFO ] pool-3-thread-1 TS_METRICS - GPUMemoryUsed.Megabytes:4962.0|#Level:Host,DeviceId:0|#hostname:ip-172-31-11-40,timestamp:1707790230
2024-02-13T02:10:30,156 [INFO ] pool-3-thread-1 TS_METRICS - GPUUtilization.Percent:43.0|#Level:Host,DeviceId:0|#hostname:ip-172-31-11-40,timestamp:1707790230
2024-02-13T02:10:30,156 [INFO ] pool-3-thread-1 TS_METRICS - MemoryAvailable.Megabytes:16826.01171875|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790230
2024-02-13T02:10:30,156 [INFO ] pool-3-thread-1 TS_METRICS - MemoryUsed.Megabytes:14397.375|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790230
2024-02-13T02:10:30,156 [INFO ] pool-3-thread-1 TS_METRICS - MemoryUtilization.Percent:47.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790230
2024-02-13T02:10:30,459 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x1776, 1776x192)
2024-02-13T02:10:30,459 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0256 ms 100.0%
2024-02-13T02:10:30,459 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_930 0.0287 ms 89.2%
2024-02-13T02:10:30,459 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_929 0.0297 ms 86.2%
2024-02-13T02:10:30,459 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_933 0.0307 ms 83.3%
2024-02-13T02:10:30,459 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_932 0.0492 ms 52.1%
2024-02-13T02:10:30,459 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_924 0.0686 ms 37.3%
2024-02-13T02:10:30,459 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_935 0.0717 ms 35.7%
2024-02-13T02:10:30,459 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_927 0.0748 ms 34.2%
2024-02-13T02:10:30,459 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_928 0.0758 ms 33.8%
2024-02-13T02:10:30,459 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_925 0.0819 ms 31.2%
2024-02-13T02:10:30,459 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.6976 seconds
2024-02-13T02:10:32,116 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x1824, 1824x192)
2024-02-13T02:10:32,116 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0256 ms 100.0%
2024-02-13T02:10:32,116 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_949 0.0296 ms 86.4%
2024-02-13T02:10:32,116 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_948 0.0307 ms 83.3%
2024-02-13T02:10:32,116 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_952 0.0317 ms 80.6%
2024-02-13T02:10:32,116 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_951 0.0502 ms 51.0%
2024-02-13T02:10:32,116 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_954 0.0737 ms 34.7%
2024-02-13T02:10:32,116 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_944 0.0758 ms 33.8%
2024-02-13T02:10:32,116 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_946 0.0758 ms 33.8%
2024-02-13T02:10:32,116 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_947 0.0768 ms 33.3%
2024-02-13T02:10:32,117 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_943 0.0778 ms 32.9%
2024-02-13T02:10:32,117 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5172 seconds
2024-02-13T02:10:33,776 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x1872, 1872x192)
2024-02-13T02:10:33,776 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0256 ms 100.0%
2024-02-13T02:10:33,776 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_968 0.0307 ms 83.3%
2024-02-13T02:10:33,776 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_967 0.0317 ms 80.6%
2024-02-13T02:10:33,776 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_971 0.0317 ms 80.6%
2024-02-13T02:10:33,776 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_970 0.0522 ms 49.0%
2024-02-13T02:10:33,776 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_962 0.0717 ms 35.7%
2024-02-13T02:10:33,776 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_973 0.0748 ms 34.2%
2024-02-13T02:10:33,776 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_966 0.0778 ms 32.9%
2024-02-13T02:10:33,776 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_965 0.0788 ms 32.5%
2024-02-13T02:10:33,776 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_963 0.0850 ms 30.1%
2024-02-13T02:10:33,776 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5176 seconds
2024-02-13T02:10:35,434 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x1920, 1920x192)
2024-02-13T02:10:35,434 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0256 ms 100.0%
2024-02-13T02:10:35,434 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_987 0.0307 ms 83.3%
2024-02-13T02:10:35,434 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_986 0.0317 ms 80.6%
2024-02-13T02:10:35,434 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_990 0.0317 ms 80.6%
2024-02-13T02:10:35,434 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_989 0.0512 ms 50.0%
2024-02-13T02:10:35,434 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_981 0.0748 ms 34.2%
2024-02-13T02:10:35,434 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_992 0.0768 ms 33.3%
2024-02-13T02:10:35,434 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_984 0.0799 ms 32.1%
2024-02-13T02:10:35,434 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_985 0.0809 ms 31.6%
2024-02-13T02:10:35,435 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_983 0.0829 ms 30.9%
2024-02-13T02:10:35,435 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5157 seconds
2024-02-13T02:10:37,093 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x1968, 1968x192)
2024-02-13T02:10:37,093 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0276 ms 100.0%
2024-02-13T02:10:37,093 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1005 0.0328 ms 84.3%
2024-02-13T02:10:37,093 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1006 0.0328 ms 84.3%
2024-02-13T02:10:37,094 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1009 0.0338 ms 81.8%
2024-02-13T02:10:37,094 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1008 0.0532 ms 51.9%
2024-02-13T02:10:37,094 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1000 0.0758 ms 36.5%
2024-02-13T02:10:37,094 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1011 0.0778 ms 35.5%
2024-02-13T02:10:37,094 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1003 0.0819 ms 33.7%
2024-02-13T02:10:37,094 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1004 0.0829 ms 33.3%
2024-02-13T02:10:37,094 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1001 0.0891 ms 31.0%
2024-02-13T02:10:37,094 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5181 seconds
2024-02-13T02:10:38,756 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x2016, 2016x192)
2024-02-13T02:10:38,757 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0276 ms 100.0%
2024-02-13T02:10:38,757 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1025 0.0317 ms 87.1%
2024-02-13T02:10:38,757 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1024 0.0328 ms 84.4%
2024-02-13T02:10:38,757 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1028 0.0338 ms 81.8%
2024-02-13T02:10:38,757 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1027 0.0532 ms 51.9%
2024-02-13T02:10:38,757 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1030 0.0799 ms 34.6%
2024-02-13T02:10:38,757 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1020 0.0829 ms 33.3%
2024-02-13T02:10:38,757 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1022 0.0829 ms 33.3%
2024-02-13T02:10:38,757 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1023 0.0840 ms 32.9%
2024-02-13T02:10:38,757 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1019 0.0850 ms 32.5%
2024-02-13T02:10:38,757 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5193 seconds
2024-02-13T02:10:40,422 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x2064, 2064x192)
2024-02-13T02:10:40,422 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0276 ms 100.0%
2024-02-13T02:10:40,422 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1044 0.0328 ms 84.4%
2024-02-13T02:10:40,422 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1043 0.0348 ms 79.4%
2024-02-13T02:10:40,422 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1047 0.0348 ms 79.4%
2024-02-13T02:10:40,422 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1046 0.0573 ms 48.2%
2024-02-13T02:10:40,422 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1038 0.0788 ms 35.1%
2024-02-13T02:10:40,422 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1049 0.0809 ms 34.2%
2024-02-13T02:10:40,422 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1041 0.0860 ms 32.1%
2024-02-13T02:10:40,422 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1042 0.0860 ms 32.1%
2024-02-13T02:10:40,423 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1039 0.0932 ms 29.7%
2024-02-13T02:10:40,423 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5221 seconds
2024-02-13T02:10:42,089 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(196x2112, 2112x1056)
2024-02-13T02:10:42,089 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1065 0.0584 ms 100.0%
2024-02-13T02:10:42,089 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1063 0.0594 ms 98.3%
2024-02-13T02:10:42,089 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1066 0.0788 ms 74.0%
2024-02-13T02:10:42,089 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1062 0.0809 ms 72.2%
2024-02-13T02:10:42,089 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1057 0.0840 ms 69.5%
2024-02-13T02:10:42,089 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1060 0.0870 ms 67.1%
2024-02-13T02:10:42,089 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1058 0.0881 ms 66.3%
2024-02-13T02:10:42,090 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1061 0.0881 ms 66.3%
2024-02-13T02:10:42,090 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1059 0.0932 ms 62.6%
2024-02-13T02:10:42,090 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0942 ms 62.0%
2024-02-13T02:10:42,090 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5213 seconds
2024-02-13T02:10:43,704 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(49x1056, 1056x192)
2024-02-13T02:10:43,704 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0164 ms 100.0%
2024-02-13T02:10:43,705 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1075 0.0205 ms 80.0%
2024-02-13T02:10:43,705 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1078 0.0205 ms 80.0%
2024-02-13T02:10:43,705 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1074 0.0225 ms 72.7%
2024-02-13T02:10:43,705 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1071 0.0287 ms 57.1%
2024-02-13T02:10:43,705 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1073 0.0307 ms 53.3%
2024-02-13T02:10:43,705 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1077 0.0328 ms 50.0%
2024-02-13T02:10:43,705 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1069 0.0451 ms 36.4%
2024-02-13T02:10:43,705 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1070 0.0481 ms 34.0%
2024-02-13T02:10:43,705 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1072 0.0492 ms 33.3%
2024-02-13T02:10:43,705 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5110 seconds
2024-02-13T02:10:44,340 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE convolution(1x192x7x7, 48x192x3x3)
2024-02-13T02:10:44,340 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   convolution 0.0317 ms 100.0%
2024-02-13T02:10:44,340 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_1083 0.0686 ms 46.3%
2024-02-13T02:10:44,340 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_1084 0.0686 ms 46.3%
2024-02-13T02:10:44,340 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_1082 0.0717 ms 44.3%
2024-02-13T02:10:44,340 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_convolution_1081 0.0850 ms 37.3%
2024-02-13T02:10:44,340 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 0.5843 seconds
2024-02-13T02:10:45,950 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(49x1104, 1104x192)
2024-02-13T02:10:45,951 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0164 ms 100.0%
2024-02-13T02:10:45,951 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1094 0.0205 ms 80.0%
2024-02-13T02:10:45,951 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1091 0.0225 ms 72.7%
2024-02-13T02:10:45,951 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1090 0.0236 ms 69.6%
2024-02-13T02:10:45,951 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1087 0.0328 ms 50.0%
2024-02-13T02:10:45,951 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1093 0.0348 ms 47.1%
2024-02-13T02:10:45,951 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1089 0.0358 ms 45.7%
2024-02-13T02:10:45,951 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1085 0.0492 ms 33.3%
2024-02-13T02:10:45,951 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1096 0.0532 ms 30.8%
2024-02-13T02:10:45,951 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1086 0.0543 ms 30.2%
2024-02-13T02:10:45,951 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5132 seconds
2024-02-13T02:10:47,586 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(49x1152, 1152x192)
2024-02-13T02:10:47,586 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0164 ms 100.0%
2024-02-13T02:10:47,586 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1110 0.0195 ms 84.2%
2024-02-13T02:10:47,586 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1107 0.0225 ms 72.7%
2024-02-13T02:10:47,586 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1106 0.0246 ms 66.7%
2024-02-13T02:10:47,586 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1103 0.0307 ms 53.3%
2024-02-13T02:10:47,586 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1105 0.0338 ms 48.5%
2024-02-13T02:10:47,586 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1109 0.0338 ms 48.5%
2024-02-13T02:10:47,586 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1101 0.0492 ms 33.3%
2024-02-13T02:10:47,586 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1104 0.0532 ms 30.8%
2024-02-13T02:10:47,586 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1102 0.0543 ms 30.2%
2024-02-13T02:10:47,586 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5133 seconds
2024-02-13T02:10:49,222 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(49x1200, 1200x192)
2024-02-13T02:10:49,222 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0164 ms 100.0%
2024-02-13T02:10:49,222 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1126 0.0215 ms 76.2%
2024-02-13T02:10:49,222 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1122 0.0246 ms 66.7%
2024-02-13T02:10:49,222 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1123 0.0246 ms 66.7%
2024-02-13T02:10:49,222 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1119 0.0358 ms 45.7%
2024-02-13T02:10:49,222 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1125 0.0358 ms 45.7%
2024-02-13T02:10:49,222 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1121 0.0379 ms 43.2%
2024-02-13T02:10:49,222 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1117 0.0532 ms 30.8%
2024-02-13T02:10:49,222 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1128 0.0573 ms 28.6%
2024-02-13T02:10:49,222 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1118 0.0584 ms 28.1%
2024-02-13T02:10:49,222 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5137 seconds
2024-02-13T02:10:50,856 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(49x1248, 1248x192)
2024-02-13T02:10:50,856 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0164 ms 100.0%
2024-02-13T02:10:50,856 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1142 0.0215 ms 76.2%
2024-02-13T02:10:50,857 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1139 0.0236 ms 69.6%
2024-02-13T02:10:50,857 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1138 0.0256 ms 64.0%
2024-02-13T02:10:50,857 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1135 0.0328 ms 50.0%
2024-02-13T02:10:50,857 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1137 0.0348 ms 47.1%
2024-02-13T02:10:50,857 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1141 0.0369 ms 44.4%
2024-02-13T02:10:50,857 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1133 0.0522 ms 31.4%
2024-02-13T02:10:50,857 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1134 0.0553 ms 29.6%
2024-02-13T02:10:50,857 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1136 0.0563 ms 29.1%
2024-02-13T02:10:50,857 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5114 seconds
2024-02-13T02:10:52,490 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(49x1296, 1296x192)
2024-02-13T02:10:52,490 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0164 ms 100.0%
2024-02-13T02:10:52,490 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1158 0.0225 ms 72.7%
2024-02-13T02:10:52,490 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1155 0.0256 ms 64.0%
2024-02-13T02:10:52,490 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1154 0.0266 ms 61.5%
2024-02-13T02:10:52,490 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1151 0.0379 ms 43.2%
2024-02-13T02:10:52,490 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1153 0.0399 ms 41.0%
2024-02-13T02:10:52,490 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1157 0.0399 ms 41.0%
2024-02-13T02:10:52,490 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1149 0.0563 ms 29.1%
2024-02-13T02:10:52,490 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1160 0.0604 ms 27.1%
2024-02-13T02:10:52,490 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1150 0.0614 ms 26.7%
2024-02-13T02:10:52,490 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5121 seconds
2024-02-13T02:10:54,125 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(49x1344, 1344x192)
2024-02-13T02:10:54,125 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0164 ms 100.0%
2024-02-13T02:10:54,126 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1174 0.0236 ms 69.6%
2024-02-13T02:10:54,126 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1171 0.0246 ms 66.7%
2024-02-13T02:10:54,126 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1170 0.0276 ms 59.3%
2024-02-13T02:10:54,126 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1167 0.0338 ms 48.5%
2024-02-13T02:10:54,126 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1169 0.0379 ms 43.3%
2024-02-13T02:10:54,126 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1173 0.0389 ms 42.1%
2024-02-13T02:10:54,126 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1165 0.0553 ms 29.6%
2024-02-13T02:10:54,126 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1166 0.0584 ms 28.1%
2024-02-13T02:10:54,126 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1168 0.0604 ms 27.1%
2024-02-13T02:10:54,126 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5127 seconds
2024-02-13T02:10:55,759 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(49x1392, 1392x192)
2024-02-13T02:10:55,759 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0164 ms 100.0%
2024-02-13T02:10:55,759 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1190 0.0236 ms 69.6%
2024-02-13T02:10:55,759 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1187 0.0276 ms 59.3%
2024-02-13T02:10:55,759 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1186 0.0287 ms 57.1%
2024-02-13T02:10:55,759 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1183 0.0399 ms 41.0%
2024-02-13T02:10:55,759 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1189 0.0410 ms 40.0%
2024-02-13T02:10:55,759 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1185 0.0430 ms 38.1%
2024-02-13T02:10:55,759 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1181 0.0604 ms 27.1%
2024-02-13T02:10:55,759 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1192 0.0645 ms 25.4%
2024-02-13T02:10:55,759 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1182 0.0655 ms 25.0%
2024-02-13T02:10:55,759 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5109 seconds
2024-02-13T02:10:57,388 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(49x1440, 1440x192)
2024-02-13T02:10:57,388 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0174 ms 100.0%
2024-02-13T02:10:57,388 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1206 0.0246 ms 70.8%
2024-02-13T02:10:57,388 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1203 0.0256 ms 68.0%
2024-02-13T02:10:57,388 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1202 0.0297 ms 58.6%
2024-02-13T02:10:57,388 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1199 0.0358 ms 48.6%
2024-02-13T02:10:57,388 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1201 0.0399 ms 43.6%
2024-02-13T02:10:57,388 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1205 0.0430 ms 40.5%
2024-02-13T02:10:57,388 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1197 0.0594 ms 29.3%
2024-02-13T02:10:57,388 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1198 0.0625 ms 27.9%
2024-02-13T02:10:57,388 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1200 0.0645 ms 27.0%
2024-02-13T02:10:57,388 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5112 seconds
2024-02-13T02:10:59,019 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(49x1488, 1488x192)
2024-02-13T02:10:59,019 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0174 ms 100.0%
2024-02-13T02:10:59,019 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1222 0.0256 ms 68.0%
2024-02-13T02:10:59,019 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1219 0.0287 ms 60.7%
2024-02-13T02:10:59,019 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1218 0.0307 ms 56.7%
2024-02-13T02:10:59,019 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1215 0.0430 ms 40.5%
2024-02-13T02:10:59,019 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1221 0.0440 ms 39.5%
2024-02-13T02:10:59,019 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1217 0.0451 ms 38.6%
2024-02-13T02:10:59,019 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1213 0.0635 ms 27.4%
2024-02-13T02:10:59,020 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1214 0.0696 ms 25.0%
2024-02-13T02:10:59,020 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1224 0.0696 ms 25.0%
2024-02-13T02:10:59,020 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5123 seconds
2024-02-13T02:11:00,652 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(49x1536, 1536x192)
2024-02-13T02:11:00,652 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0164 ms 100.0%
2024-02-13T02:11:00,652 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1238 0.0246 ms 66.7%
2024-02-13T02:11:00,652 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1235 0.0276 ms 59.3%
2024-02-13T02:11:00,652 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1234 0.0307 ms 53.3%
2024-02-13T02:11:00,652 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1231 0.0389 ms 42.1%
2024-02-13T02:11:00,652 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1237 0.0430 ms 38.1%
2024-02-13T02:11:00,652 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1233 0.0440 ms 37.2%
2024-02-13T02:11:00,652 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1229 0.0635 ms 25.8%
2024-02-13T02:11:00,652 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1232 0.0696 ms 23.5%
2024-02-13T02:11:00,652 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1230 0.0707 ms 23.2%
2024-02-13T02:11:00,652 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5110 seconds
2024-02-13T02:11:02,286 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(49x1584, 1584x192)
2024-02-13T02:11:02,287 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0184 ms 100.0%
2024-02-13T02:11:02,287 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1254 0.0266 ms 69.2%
2024-02-13T02:11:02,287 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1251 0.0307 ms 60.0%
2024-02-13T02:11:02,287 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1250 0.0317 ms 58.1%
2024-02-13T02:11:02,287 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1247 0.0451 ms 40.9%
2024-02-13T02:11:02,287 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1253 0.0461 ms 40.0%
2024-02-13T02:11:02,287 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1249 0.0481 ms 38.3%
2024-02-13T02:11:02,287 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1245 0.0676 ms 27.3%
2024-02-13T02:11:02,287 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1248 0.0737 ms 25.0%
2024-02-13T02:11:02,287 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1256 0.0737 ms 25.0%
2024-02-13T02:11:02,287 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5152 seconds
2024-02-13T02:11:03,923 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(49x1632, 1632x192)
2024-02-13T02:11:03,923 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0184 ms 100.0%
2024-02-13T02:11:03,923 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1270 0.0266 ms 69.2%
2024-02-13T02:11:03,923 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1267 0.0287 ms 64.3%
2024-02-13T02:11:03,923 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1266 0.0328 ms 56.3%
2024-02-13T02:11:03,923 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1263 0.0410 ms 45.0%
2024-02-13T02:11:03,923 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1265 0.0451 ms 40.9%
2024-02-13T02:11:03,923 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1269 0.0471 ms 39.1%
2024-02-13T02:11:03,923 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1261 0.0666 ms 27.7%
2024-02-13T02:11:03,923 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1262 0.0696 ms 26.5%
2024-02-13T02:11:03,923 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1264 0.0727 ms 25.4%
2024-02-13T02:11:03,923 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5149 seconds
2024-02-13T02:11:05,558 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(49x1680, 1680x192)
2024-02-13T02:11:05,558 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0184 ms 100.0%
2024-02-13T02:11:05,558 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1286 0.0287 ms 64.3%
2024-02-13T02:11:05,558 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1283 0.0317 ms 58.1%
2024-02-13T02:11:05,558 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1282 0.0328 ms 56.3%
2024-02-13T02:11:05,558 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1279 0.0481 ms 38.3%
2024-02-13T02:11:05,558 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1285 0.0481 ms 38.3%
2024-02-13T02:11:05,558 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1281 0.0512 ms 36.0%
2024-02-13T02:11:05,558 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1277 0.0717 ms 25.7%
2024-02-13T02:11:05,558 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1278 0.0778 ms 23.7%
2024-02-13T02:11:05,558 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1280 0.0788 ms 23.4%
2024-02-13T02:11:05,558 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5142 seconds
2024-02-13T02:11:07,194 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(49x1728, 1728x192)
2024-02-13T02:11:07,194 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0184 ms 100.0%
2024-02-13T02:11:07,194 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1302 0.0276 ms 66.7%
2024-02-13T02:11:07,194 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1299 0.0307 ms 60.0%
2024-02-13T02:11:07,194 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1298 0.0338 ms 54.5%
2024-02-13T02:11:07,194 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1295 0.0430 ms 42.9%
2024-02-13T02:11:07,194 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1297 0.0471 ms 39.1%
2024-02-13T02:11:07,194 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1301 0.0481 ms 38.3%
2024-02-13T02:11:07,195 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1293 0.0696 ms 26.5%
2024-02-13T02:11:07,195 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1294 0.0737 ms 25.0%
2024-02-13T02:11:07,195 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1296 0.0768 ms 24.0%
2024-02-13T02:11:07,195 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5146 seconds
2024-02-13T02:11:08,833 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(49x1776, 1776x192)
2024-02-13T02:11:08,833 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0184 ms 100.0%
2024-02-13T02:11:08,833 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1318 0.0287 ms 64.3%
2024-02-13T02:11:08,833 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1315 0.0328 ms 56.3%
2024-02-13T02:11:08,833 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1314 0.0348 ms 52.9%
2024-02-13T02:11:08,833 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1311 0.0492 ms 37.5%
2024-02-13T02:11:08,833 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1317 0.0502 ms 36.7%
2024-02-13T02:11:08,833 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1313 0.0532 ms 34.6%
2024-02-13T02:11:08,833 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1309 0.0748 ms 24.7%
2024-02-13T02:11:08,833 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1310 0.0819 ms 22.5%
2024-02-13T02:11:08,833 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1320 0.0819 ms 22.5%
2024-02-13T02:11:08,833 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5156 seconds
2024-02-13T02:11:10,469 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(49x1824, 1824x192)
2024-02-13T02:11:10,469 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0184 ms 100.0%
2024-02-13T02:11:10,469 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1334 0.0307 ms 60.0%
2024-02-13T02:11:10,470 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1331 0.0328 ms 56.3%
2024-02-13T02:11:10,470 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1330 0.0348 ms 52.9%
2024-02-13T02:11:10,470 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1327 0.0451 ms 40.9%
2024-02-13T02:11:10,470 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1329 0.0492 ms 37.5%
2024-02-13T02:11:10,470 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1333 0.0512 ms 36.0%
2024-02-13T02:11:10,470 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1325 0.0737 ms 25.0%
2024-02-13T02:11:10,470 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1326 0.0778 ms 23.7%
2024-02-13T02:11:10,470 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1328 0.0819 ms 22.5%
2024-02-13T02:11:10,470 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5140 seconds
2024-02-13T02:11:12,338 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(49x1872, 1872x192)
2024-02-13T02:11:12,339 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0184 ms 100.0%
2024-02-13T02:11:12,339 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1350 0.0307 ms 60.1%
2024-02-13T02:11:12,339 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1347 0.0348 ms 52.9%
2024-02-13T02:11:12,339 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1346 0.0369 ms 50.0%
2024-02-13T02:11:12,339 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1343 0.0522 ms 35.3%
2024-02-13T02:11:12,339 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1349 0.0532 ms 34.6%
2024-02-13T02:11:12,339 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1345 0.0563 ms 32.7%
2024-02-13T02:11:12,339 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1341 0.0788 ms 23.4%
2024-02-13T02:11:12,339 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1342 0.0860 ms 21.4%
2024-02-13T02:11:12,339 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1352 0.0860 ms 21.4%
2024-02-13T02:11:12,339 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5178 seconds
2024-02-13T02:11:13,983 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(49x1920, 1920x192)
2024-02-13T02:11:13,983 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0184 ms 100.0%
2024-02-13T02:11:13,983 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1366 0.0297 ms 62.1%
2024-02-13T02:11:13,983 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1363 0.0328 ms 56.3%
2024-02-13T02:11:13,983 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1362 0.0369 ms 50.0%
2024-02-13T02:11:13,983 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1359 0.0471 ms 39.1%
2024-02-13T02:11:13,983 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1361 0.0522 ms 35.3%
2024-02-13T02:11:13,984 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1365 0.0522 ms 35.3%
2024-02-13T02:11:13,984 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1357 0.0778 ms 23.7%
2024-02-13T02:11:13,984 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1360 0.0849 ms 21.7%
2024-02-13T02:11:13,984 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1358 0.0860 ms 21.4%
2024-02-13T02:11:13,984 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5176 seconds
2024-02-13T02:11:15,627 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(49x1968, 1968x192)
2024-02-13T02:11:15,627 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0184 ms 100.0%
2024-02-13T02:11:15,627 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1382 0.0317 ms 58.1%
2024-02-13T02:11:15,627 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1379 0.0358 ms 51.4%
2024-02-13T02:11:15,627 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1378 0.0379 ms 48.6%
2024-02-13T02:11:15,627 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1381 0.0543 ms 34.0%
2024-02-13T02:11:15,627 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1375 0.0553 ms 33.3%
2024-02-13T02:11:15,628 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1377 0.0573 ms 32.1%
2024-02-13T02:11:15,628 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1373 0.0819 ms 22.5%
2024-02-13T02:11:15,628 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1374 0.0901 ms 20.5%
2024-02-13T02:11:15,628 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1384 0.0901 ms 20.5%
2024-02-13T02:11:15,628 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5166 seconds
2024-02-13T02:11:17,270 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(49x2016, 2016x192)
2024-02-13T02:11:17,270 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0184 ms 100.0%
2024-02-13T02:11:17,270 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1398 0.0317 ms 58.1%
2024-02-13T02:11:17,270 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1395 0.0348 ms 52.9%
2024-02-13T02:11:17,270 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1394 0.0389 ms 47.4%
2024-02-13T02:11:17,270 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1391 0.0492 ms 37.5%
2024-02-13T02:11:17,270 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1393 0.0543 ms 34.0%
2024-02-13T02:11:17,270 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1397 0.0563 ms 32.7%
2024-02-13T02:11:17,271 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1389 0.0809 ms 22.8%
2024-02-13T02:11:17,271 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1390 0.0860 ms 21.4%
2024-02-13T02:11:17,271 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1392 0.0881 ms 20.9%
2024-02-13T02:11:17,271 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5161 seconds
2024-02-13T02:11:18,916 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(49x2064, 2064x192)
2024-02-13T02:11:18,917 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0195 ms 100.0%
2024-02-13T02:11:18,917 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1414 0.0328 ms 59.4%
2024-02-13T02:11:18,917 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1411 0.0379 ms 51.4%
2024-02-13T02:11:18,917 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1410 0.0389 ms 50.0%
2024-02-13T02:11:18,917 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1407 0.0573 ms 33.9%
2024-02-13T02:11:18,917 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1413 0.0584 ms 33.3%
2024-02-13T02:11:18,917 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1409 0.0604 ms 32.2%
2024-02-13T02:11:18,917 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1405 0.0860 ms 22.6%
2024-02-13T02:11:18,917 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1406 0.0942 ms 20.7%
2024-02-13T02:11:18,917 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1416 0.0942 ms 20.7%
2024-02-13T02:11:18,917 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5178 seconds
2024-02-13T02:11:20,561 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(49x2112, 2112x192)
2024-02-13T02:11:20,562 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0195 ms 100.0%
2024-02-13T02:11:20,562 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1430 0.0328 ms 59.4%
2024-02-13T02:11:20,562 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1427 0.0358 ms 54.3%
2024-02-13T02:11:20,562 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1426 0.0399 ms 48.7%
2024-02-13T02:11:20,562 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1423 0.0512 ms 38.0%
2024-02-13T02:11:20,562 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1425 0.0563 ms 34.5%
2024-02-13T02:11:20,562 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1429 0.0573 ms 33.9%
2024-02-13T02:11:20,562 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1421 0.0840 ms 23.2%
2024-02-13T02:11:20,562 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1422 0.0891 ms 21.8%
2024-02-13T02:11:20,562 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1424 0.0922 ms 21.1%
2024-02-13T02:11:20,562 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5182 seconds
2024-02-13T02:11:22,207 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE mm(49x2160, 2160x192)
2024-02-13T02:11:22,207 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   mm 0.0195 ms 100.0%
2024-02-13T02:11:22,207 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1446 0.0338 ms 57.6%
2024-02-13T02:11:22,207 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1443 0.0389 ms 50.0%
2024-02-13T02:11:22,207 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1442 0.0410 ms 47.5%
2024-02-13T02:11:22,207 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1439 0.0594 ms 32.8%
2024-02-13T02:11:22,207 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1445 0.0604 ms 32.2%
2024-02-13T02:11:22,207 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1441 0.0635 ms 30.6%
2024-02-13T02:11:22,207 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1437 0.0901 ms 21.6%
2024-02-13T02:11:22,207 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1438 0.0983 ms 19.8%
2024-02-13T02:11:22,207 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1448 0.0983 ms 19.8%
2024-02-13T02:11:22,207 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.5165 seconds
2024-02-13T02:11:23,977 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - AUTOTUNE addmm(1x1000, 1x2208, 2208x1000)
2024-02-13T02:11:23,977 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   bias_addmm 0.0287 ms 100.0%
2024-02-13T02:11:23,977 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   addmm 0.0297 ms 96.6%
2024-02-13T02:11:23,977 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1459 0.0328 ms 87.5%
2024-02-13T02:11:23,977 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1461 0.0338 ms 84.8%
2024-02-13T02:11:23,977 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1457 0.0348 ms 82.4%
2024-02-13T02:11:23,977 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1458 0.0348 ms 82.4%
2024-02-13T02:11:23,978 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1456 0.0379 ms 75.7%
2024-02-13T02:11:23,978 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1455 0.0389 ms 73.7%
2024-02-13T02:11:23,978 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1462 0.0399 ms 71.8%
2024-02-13T02:11:23,978 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG -   triton_mm_1454 0.0440 ms 65.1%
2024-02-13T02:11:23,978 [WARN ] W-9000-densenet161_1.0-stderr MODEL_LOG - SingleProcess AUTOTUNE takes 1.6230 seconds
2024-02-13T02:11:30,107 [INFO ] pool-3-thread-1 TS_METRICS - CPUUtilization.Percent:50.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790290
2024-02-13T02:11:30,107 [INFO ] pool-3-thread-1 TS_METRICS - DiskAvailable.Gigabytes:31.91851806640625|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790290
2024-02-13T02:11:30,107 [INFO ] pool-3-thread-1 TS_METRICS - DiskUsage.Gigabytes:258.6324272155762|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790290
2024-02-13T02:11:30,107 [INFO ] pool-3-thread-1 TS_METRICS - DiskUtilization.Percent:89.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790290
2024-02-13T02:11:30,108 [INFO ] pool-3-thread-1 TS_METRICS - GPUMemoryUtilization.Percent:21.5650512419663|#Level:Host,DeviceId:0|#hostname:ip-172-31-11-40,timestamp:1707790290
2024-02-13T02:11:30,108 [INFO ] pool-3-thread-1 TS_METRICS - GPUMemoryUsed.Megabytes:4966.0|#Level:Host,DeviceId:0|#hostname:ip-172-31-11-40,timestamp:1707790290
2024-02-13T02:11:30,108 [INFO ] pool-3-thread-1 TS_METRICS - GPUUtilization.Percent:0.0|#Level:Host,DeviceId:0|#hostname:ip-172-31-11-40,timestamp:1707790290
2024-02-13T02:11:30,108 [INFO ] pool-3-thread-1 TS_METRICS - MemoryAvailable.Megabytes:16628.96484375|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790290
2024-02-13T02:11:30,108 [INFO ] pool-3-thread-1 TS_METRICS - MemoryUsed.Megabytes:14594.421875|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790290
2024-02-13T02:11:30,108 [INFO ] pool-3-thread-1 TS_METRICS - MemoryUtilization.Percent:47.6|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790290
2024-02-13T02:12:30,434 [INFO ] pool-3-thread-2 TS_METRICS - CPUUtilization.Percent:0.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790350
2024-02-13T02:12:30,434 [INFO ] pool-3-thread-2 TS_METRICS - DiskAvailable.Gigabytes:31.843250274658203|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790350
2024-02-13T02:12:30,434 [INFO ] pool-3-thread-2 TS_METRICS - DiskUsage.Gigabytes:258.7076950073242|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790350
2024-02-13T02:12:30,435 [INFO ] pool-3-thread-2 TS_METRICS - DiskUtilization.Percent:89.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790350
2024-02-13T02:12:30,435 [INFO ] pool-3-thread-2 TS_METRICS - GPUMemoryUtilization.Percent:21.730067743616466|#Level:Host,DeviceId:0|#hostname:ip-172-31-11-40,timestamp:1707790350
2024-02-13T02:12:30,435 [INFO ] pool-3-thread-2 TS_METRICS - GPUMemoryUsed.Megabytes:5004.0|#Level:Host,DeviceId:0|#hostname:ip-172-31-11-40,timestamp:1707790350
2024-02-13T02:12:30,435 [INFO ] pool-3-thread-2 TS_METRICS - GPUUtilization.Percent:95.0|#Level:Host,DeviceId:0|#hostname:ip-172-31-11-40,timestamp:1707790350
2024-02-13T02:12:30,435 [INFO ] pool-3-thread-2 TS_METRICS - MemoryAvailable.Megabytes:16108.33203125|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790350
2024-02-13T02:12:30,435 [INFO ] pool-3-thread-2 TS_METRICS - MemoryUsed.Megabytes:15111.26953125|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790350
2024-02-13T02:12:30,435 [INFO ] pool-3-thread-2 TS_METRICS - MemoryUtilization.Percent:49.2|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790350
2024-02-13T02:12:33,728 [INFO ] W-9000-densenet161_1.0-stdout MODEL_LOG - TorchInductor FX Graph cache hit 0, FX Graph cache miss 1
2024-02-13T02:12:33,729 [INFO ] W-9000-densenet161_1.0-stdout org.pytorch.serve.wlm.WorkerLifeCycle - result=[METRICS]HandlerTime.Milliseconds:224627.97|#ModelName:densenet161,Level:Model|#type:GAUGE|#hostname:ip-172-31-11-40,1707790353,ec0ef4ec-66df-4fc7-ad63-4c0103d1a003, pattern=[METRICS]
2024-02-13T02:12:33,729 [INFO ] W-9000-densenet161_1.0-stdout MODEL_METRICS - HandlerTime.ms:224627.97|#ModelName:densenet161,Level:Model|#hostname:ip-172-31-11-40,requestID:ec0ef4ec-66df-4fc7-ad63-4c0103d1a003,timestamp:1707790353
2024-02-13T02:12:33,729 [INFO ] W-9000-densenet161_1.0-stdout org.pytorch.serve.wlm.WorkerLifeCycle - result=[METRICS]PredictionTime.Milliseconds:224628.22|#ModelName:densenet161,Level:Model|#type:GAUGE|#hostname:ip-172-31-11-40,1707790353,ec0ef4ec-66df-4fc7-ad63-4c0103d1a003, pattern=[METRICS]
2024-02-13T02:12:33,729 [INFO ] W-9000-densenet161_1.0-stdout MODEL_METRICS - PredictionTime.ms:224628.22|#ModelName:densenet161,Level:Model|#hostname:ip-172-31-11-40,requestID:ec0ef4ec-66df-4fc7-ad63-4c0103d1a003,timestamp:1707790353
2024-02-13T02:12:33,730 [INFO ] W-9000-densenet161_1.0 ACCESS_LOG - /127.0.0.1:58942 "PUT /predictions/densenet161 HTTP/1.1" 200 224635
2024-02-13T02:12:33,730 [INFO ] W-9000-densenet161_1.0 TS_METRICS - Requests2XX.Count:1.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790353
2024-02-13T02:12:33,731 [INFO ] W-9000-densenet161_1.0 TS_METRICS - ts_inference_latency_microseconds.Microseconds:2.24631373295E8|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790353
2024-02-13T02:12:33,731 [INFO ] W-9000-densenet161_1.0 TS_METRICS - ts_queue_latency_microseconds.Microseconds:178.459|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790353
2024-02-13T02:12:33,731 [DEBUG] W-9000-densenet161_1.0 org.pytorch.serve.job.RestJob - Waiting time ns: 178459, Backend time ns: 224632419668
2024-02-13T02:12:33,731 [INFO ] W-9000-densenet161_1.0 TS_METRICS - QueueTime.Milliseconds:0.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790353
2024-02-13T02:12:33,731 [INFO ] W-9000-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Backend response time: 224631
2024-02-13T02:12:33,731 [INFO ] W-9000-densenet161_1.0 TS_METRICS - WorkerThreadTime.Milliseconds:2.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790353
2024-02-13T02:12:33,754 [INFO ] epollEventLoopGroup-3-2 TS_METRICS - ts_inference_requests_total.Count:1.0|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790353
2024-02-13T02:12:33,754 [DEBUG] W-9002-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Flushing req.cmd PREDICT repeats 1 to backend at: 1707790353754
2024-02-13T02:12:33,754 [INFO ] W-9002-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Looping backend response at: 1707790353754
2024-02-13T02:12:33,756 [INFO ] W-9002-densenet161_1.0-stdout MODEL_LOG - Backend received inference at: 1707790353
2024-02-13T02:12:49,634 [INFO ] W-9002-densenet161_1.0-stdout MODEL_LOG - TorchInductor FX Graph cache hit 1, FX Graph cache miss 0
2024-02-13T02:12:49,638 [INFO ] W-9002-densenet161_1.0-stdout org.pytorch.serve.wlm.WorkerLifeCycle - result=[METRICS]HandlerTime.Milliseconds:15881.95|#ModelName:densenet161,Level:Model|#type:GAUGE|#hostname:ip-172-31-11-40,1707790369,cb9a4b12-b33b-4238-b098-b684d2dcd97e, pattern=[METRICS]
2024-02-13T02:12:49,638 [INFO ] W-9002-densenet161_1.0-stdout MODEL_METRICS - HandlerTime.ms:15881.95|#ModelName:densenet161,Level:Model|#hostname:ip-172-31-11-40,requestID:cb9a4b12-b33b-4238-b098-b684d2dcd97e,timestamp:1707790369
2024-02-13T02:12:49,638 [INFO ] W-9002-densenet161_1.0-stdout org.pytorch.serve.wlm.WorkerLifeCycle - result=[METRICS]PredictionTime.Milliseconds:15882.16|#ModelName:densenet161,Level:Model|#type:GAUGE|#hostname:ip-172-31-11-40,1707790369,cb9a4b12-b33b-4238-b098-b684d2dcd97e, pattern=[METRICS]
2024-02-13T02:12:49,638 [INFO ] W-9002-densenet161_1.0-stdout MODEL_METRICS - PredictionTime.ms:15882.16|#ModelName:densenet161,Level:Model|#hostname:ip-172-31-11-40,requestID:cb9a4b12-b33b-4238-b098-b684d2dcd97e,timestamp:1707790369
2024-02-13T02:12:49,638 [INFO ] W-9002-densenet161_1.0 ACCESS_LOG - /127.0.0.1:51942 "PUT /predictions/densenet161 HTTP/1.1" 200 15887
2024-02-13T02:12:49,639 [INFO ] W-9002-densenet161_1.0 TS_METRICS - Requests2XX.Count:1.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790369
2024-02-13T02:12:49,639 [INFO ] W-9002-densenet161_1.0 TS_METRICS - ts_inference_latency_microseconds.Microseconds:1.5884248955E7|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790369
2024-02-13T02:12:49,639 [INFO ] W-9002-densenet161_1.0 TS_METRICS - ts_queue_latency_microseconds.Microseconds:93.775|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790369
2024-02-13T02:12:49,639 [DEBUG] W-9002-densenet161_1.0 org.pytorch.serve.job.RestJob - Waiting time ns: 93775, Backend time ns: 15884838064
2024-02-13T02:12:49,639 [INFO ] W-9002-densenet161_1.0 TS_METRICS - QueueTime.Milliseconds:0.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790369
2024-02-13T02:12:49,639 [INFO ] W-9002-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Backend response time: 15883
2024-02-13T02:12:49,639 [INFO ] W-9002-densenet161_1.0 TS_METRICS - WorkerThreadTime.Milliseconds:2.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790369
2024-02-13T02:12:49,657 [INFO ] epollEventLoopGroup-3-3 TS_METRICS - ts_inference_requests_total.Count:1.0|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790369
2024-02-13T02:12:49,657 [DEBUG] W-9001-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Flushing req.cmd PREDICT repeats 1 to backend at: 1707790369657
2024-02-13T02:12:49,657 [INFO ] W-9001-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Looping backend response at: 1707790369657
2024-02-13T02:12:49,658 [INFO ] W-9001-densenet161_1.0-stdout MODEL_LOG - Backend received inference at: 1707790369
2024-02-13T02:13:05,487 [INFO ] W-9001-densenet161_1.0-stdout MODEL_LOG - TorchInductor FX Graph cache hit 1, FX Graph cache miss 0
2024-02-13T02:13:05,490 [INFO ] W-9001-densenet161_1.0-stdout org.pytorch.serve.wlm.WorkerLifeCycle - result=[METRICS]HandlerTime.Milliseconds:15831.69|#ModelName:densenet161,Level:Model|#type:GAUGE|#hostname:ip-172-31-11-40,1707790385,d8ce5ebd-cb1d-40d8-b8f8-97416b11a4a0, pattern=[METRICS]
2024-02-13T02:13:05,490 [INFO ] W-9001-densenet161_1.0-stdout MODEL_METRICS - HandlerTime.ms:15831.69|#ModelName:densenet161,Level:Model|#hostname:ip-172-31-11-40,requestID:d8ce5ebd-cb1d-40d8-b8f8-97416b11a4a0,timestamp:1707790385
2024-02-13T02:13:05,491 [INFO ] W-9001-densenet161_1.0-stdout org.pytorch.serve.wlm.WorkerLifeCycle - result=[METRICS]PredictionTime.Milliseconds:15831.9|#ModelName:densenet161,Level:Model|#type:GAUGE|#hostname:ip-172-31-11-40,1707790385,d8ce5ebd-cb1d-40d8-b8f8-97416b11a4a0, pattern=[METRICS]
2024-02-13T02:13:05,491 [INFO ] W-9001-densenet161_1.0-stdout MODEL_METRICS - PredictionTime.ms:15831.9|#ModelName:densenet161,Level:Model|#hostname:ip-172-31-11-40,requestID:d8ce5ebd-cb1d-40d8-b8f8-97416b11a4a0,timestamp:1707790385
2024-02-13T02:13:05,491 [INFO ] W-9001-densenet161_1.0 ACCESS_LOG - /127.0.0.1:44444 "PUT /predictions/densenet161 HTTP/1.1" 200 15835
2024-02-13T02:13:05,491 [INFO ] W-9001-densenet161_1.0 TS_METRICS - Requests2XX.Count:1.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790385
2024-02-13T02:13:05,491 [INFO ] W-9001-densenet161_1.0 TS_METRICS - ts_inference_latency_microseconds.Microseconds:1.583358301E7|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790385
2024-02-13T02:13:05,491 [INFO ] W-9001-densenet161_1.0 TS_METRICS - ts_queue_latency_microseconds.Microseconds:91.465|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790385
2024-02-13T02:13:05,492 [DEBUG] W-9001-densenet161_1.0 org.pytorch.serve.job.RestJob - Waiting time ns: 91465, Backend time ns: 15834290115
2024-02-13T02:13:05,492 [INFO ] W-9001-densenet161_1.0 TS_METRICS - QueueTime.Milliseconds:0.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790385
2024-02-13T02:13:05,492 [INFO ] W-9001-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Backend response time: 15834
2024-02-13T02:13:05,492 [INFO ] W-9001-densenet161_1.0 TS_METRICS - WorkerThreadTime.Milliseconds:1.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790385
2024-02-13T02:13:05,509 [INFO ] epollEventLoopGroup-3-4 TS_METRICS - ts_inference_requests_total.Count:1.0|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790385
2024-02-13T02:13:05,510 [DEBUG] W-9003-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Flushing req.cmd PREDICT repeats 1 to backend at: 1707790385510
2024-02-13T02:13:05,510 [INFO ] W-9003-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Looping backend response at: 1707790385510
2024-02-13T02:13:05,511 [INFO ] W-9003-densenet161_1.0-stdout MODEL_LOG - Backend received inference at: 1707790385
2024-02-13T02:13:21,554 [INFO ] W-9003-densenet161_1.0-stdout MODEL_LOG - TorchInductor FX Graph cache hit 1, FX Graph cache miss 0
2024-02-13T02:13:21,557 [INFO ] W-9003-densenet161_1.0-stdout org.pytorch.serve.wlm.WorkerLifeCycle - result=[METRICS]HandlerTime.Milliseconds:16045.7|#ModelName:densenet161,Level:Model|#type:GAUGE|#hostname:ip-172-31-11-40,1707790401,d6044146-9c2d-407a-8da9-b1502f36111f, pattern=[METRICS]
2024-02-13T02:13:21,557 [INFO ] W-9003-densenet161_1.0-stdout MODEL_METRICS - HandlerTime.ms:16045.7|#ModelName:densenet161,Level:Model|#hostname:ip-172-31-11-40,requestID:d6044146-9c2d-407a-8da9-b1502f36111f,timestamp:1707790401
2024-02-13T02:13:21,557 [INFO ] W-9003-densenet161_1.0-stdout org.pytorch.serve.wlm.WorkerLifeCycle - result=[METRICS]PredictionTime.Milliseconds:16045.92|#ModelName:densenet161,Level:Model|#type:GAUGE|#hostname:ip-172-31-11-40,1707790401,d6044146-9c2d-407a-8da9-b1502f36111f, pattern=[METRICS]
2024-02-13T02:13:21,557 [INFO ] W-9003-densenet161_1.0-stdout MODEL_METRICS - PredictionTime.ms:16045.92|#ModelName:densenet161,Level:Model|#hostname:ip-172-31-11-40,requestID:d6044146-9c2d-407a-8da9-b1502f36111f,timestamp:1707790401
2024-02-13T02:13:21,557 [INFO ] W-9003-densenet161_1.0 ACCESS_LOG - /127.0.0.1:40406 "PUT /predictions/densenet161 HTTP/1.1" 200 16048
2024-02-13T02:13:21,558 [INFO ] W-9003-densenet161_1.0 TS_METRICS - Requests2XX.Count:1.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790401
2024-02-13T02:13:21,558 [INFO ] W-9003-densenet161_1.0 TS_METRICS - ts_inference_latency_microseconds.Microseconds:1.6047603403E7|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790401
2024-02-13T02:13:21,558 [INFO ] W-9003-densenet161_1.0 TS_METRICS - ts_queue_latency_microseconds.Microseconds:104.696|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790401
2024-02-13T02:13:21,558 [DEBUG] W-9003-densenet161_1.0 org.pytorch.serve.job.RestJob - Waiting time ns: 104696, Backend time ns: 16048289246
2024-02-13T02:13:21,558 [INFO ] W-9003-densenet161_1.0 TS_METRICS - QueueTime.Milliseconds:0.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790401
2024-02-13T02:13:21,558 [INFO ] W-9003-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Backend response time: 16047
2024-02-13T02:13:21,558 [INFO ] W-9003-densenet161_1.0 TS_METRICS - WorkerThreadTime.Milliseconds:1.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790401
2024-02-13T02:13:30,067 [INFO ] pool-3-thread-2 TS_METRICS - CPUUtilization.Percent:0.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790410
2024-02-13T02:13:30,067 [INFO ] pool-3-thread-2 TS_METRICS - DiskAvailable.Gigabytes:31.843128204345703|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790410
2024-02-13T02:13:30,067 [INFO ] pool-3-thread-2 TS_METRICS - DiskUsage.Gigabytes:258.7078170776367|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790410
2024-02-13T02:13:30,067 [INFO ] pool-3-thread-2 TS_METRICS - DiskUtilization.Percent:89.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790410
2024-02-13T02:13:30,067 [INFO ] pool-3-thread-2 TS_METRICS - GPUMemoryUtilization.Percent:31.292339760291817|#Level:Host,DeviceId:0|#hostname:ip-172-31-11-40,timestamp:1707790410
2024-02-13T02:13:30,067 [INFO ] pool-3-thread-2 TS_METRICS - GPUMemoryUsed.Megabytes:7206.0|#Level:Host,DeviceId:0|#hostname:ip-172-31-11-40,timestamp:1707790410
2024-02-13T02:13:30,068 [INFO ] pool-3-thread-2 TS_METRICS - GPUUtilization.Percent:0.0|#Level:Host,DeviceId:0|#hostname:ip-172-31-11-40,timestamp:1707790410
2024-02-13T02:13:30,068 [INFO ] pool-3-thread-2 TS_METRICS - MemoryAvailable.Megabytes:7564.70703125|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790410
2024-02-13T02:13:30,068 [INFO ] pool-3-thread-2 TS_METRICS - MemoryUsed.Megabytes:23637.65234375|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790410
2024-02-13T02:13:30,068 [INFO ] pool-3-thread-2 TS_METRICS - MemoryUtilization.Percent:76.2|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790410
2024-02-13T02:13:44,693 [INFO ] epollEventLoopGroup-3-5 TS_METRICS - ts_inference_requests_total.Count:1.0|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790424
2024-02-13T02:13:44,693 [DEBUG] W-9000-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Flushing req.cmd PREDICT repeats 1 to backend at: 1707790424693
2024-02-13T02:13:44,693 [INFO ] W-9000-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Looping backend response at: 1707790424693
2024-02-13T02:13:44,694 [INFO ] W-9000-densenet161_1.0-stdout MODEL_LOG - Backend received inference at: 1707790424
2024-02-13T02:13:45,164 [INFO ] W-9000-densenet161_1.0-stdout MODEL_LOG - TorchInductor FX Graph cache hit 0, FX Graph cache miss 1
2024-02-13T02:13:45,164 [INFO ] W-9000-densenet161_1.0-stdout org.pytorch.serve.wlm.WorkerLifeCycle - result=[METRICS]HandlerTime.Milliseconds:470.05|#ModelName:densenet161,Level:Model|#type:GAUGE|#hostname:ip-172-31-11-40,1707790425,3ce15bbc-d62b-4bc2-987a-9c07d5e25785, pattern=[METRICS]
2024-02-13T02:13:45,165 [INFO ] W-9000-densenet161_1.0-stdout MODEL_METRICS - HandlerTime.ms:470.05|#ModelName:densenet161,Level:Model|#hostname:ip-172-31-11-40,requestID:3ce15bbc-d62b-4bc2-987a-9c07d5e25785,timestamp:1707790425
2024-02-13T02:13:45,165 [INFO ] W-9000-densenet161_1.0-stdout org.pytorch.serve.wlm.WorkerLifeCycle - result=[METRICS]PredictionTime.Milliseconds:470.2|#ModelName:densenet161,Level:Model|#type:GAUGE|#hostname:ip-172-31-11-40,1707790425,3ce15bbc-d62b-4bc2-987a-9c07d5e25785, pattern=[METRICS]
2024-02-13T02:13:45,165 [INFO ] W-9000-densenet161_1.0-stdout MODEL_METRICS - PredictionTime.ms:470.2|#ModelName:densenet161,Level:Model|#hostname:ip-172-31-11-40,requestID:3ce15bbc-d62b-4bc2-987a-9c07d5e25785,timestamp:1707790425
2024-02-13T02:13:45,165 [INFO ] W-9000-densenet161_1.0 ACCESS_LOG - /127.0.0.1:59766 "PUT /predictions/densenet161 HTTP/1.1" 200 473
2024-02-13T02:13:45,165 [INFO ] W-9000-densenet161_1.0 TS_METRICS - Requests2XX.Count:1.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790425
2024-02-13T02:13:45,165 [INFO ] W-9000-densenet161_1.0 TS_METRICS - ts_inference_latency_microseconds.Microseconds:471788.556|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790425
2024-02-13T02:13:45,165 [INFO ] W-9000-densenet161_1.0 TS_METRICS - ts_queue_latency_microseconds.Microseconds:94.285|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790425
2024-02-13T02:13:45,166 [DEBUG] W-9000-densenet161_1.0 org.pytorch.serve.job.RestJob - Waiting time ns: 94285, Backend time ns: 472461989
2024-02-13T02:13:45,166 [INFO ] W-9000-densenet161_1.0 TS_METRICS - QueueTime.Milliseconds:0.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790425
2024-02-13T02:13:45,166 [INFO ] W-9000-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Backend response time: 472
2024-02-13T02:13:45,166 [INFO ] W-9000-densenet161_1.0 TS_METRICS - WorkerThreadTime.Milliseconds:1.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790425
2024-02-13T02:13:45,183 [INFO ] epollEventLoopGroup-3-6 TS_METRICS - ts_inference_requests_total.Count:1.0|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790425
2024-02-13T02:13:45,183 [DEBUG] W-9002-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Flushing req.cmd PREDICT repeats 1 to backend at: 1707790425183
2024-02-13T02:13:45,183 [INFO ] W-9002-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Looping backend response at: 1707790425183
2024-02-13T02:13:45,184 [INFO ] W-9002-densenet161_1.0-stdout MODEL_LOG - Backend received inference at: 1707790425
2024-02-13T02:13:45,373 [INFO ] W-9002-densenet161_1.0-stdout MODEL_LOG - TorchInductor FX Graph cache hit 1, FX Graph cache miss 0
2024-02-13T02:13:45,373 [INFO ] W-9002-densenet161_1.0-stdout org.pytorch.serve.wlm.WorkerLifeCycle - result=[METRICS]HandlerTime.Milliseconds:188.84|#ModelName:densenet161,Level:Model|#type:GAUGE|#hostname:ip-172-31-11-40,1707790425,e7140df4-7ba2-460c-bea7-49ce4ba127f8, pattern=[METRICS]
2024-02-13T02:13:45,373 [INFO ] W-9002-densenet161_1.0-stdout MODEL_METRICS - HandlerTime.ms:188.84|#ModelName:densenet161,Level:Model|#hostname:ip-172-31-11-40,requestID:e7140df4-7ba2-460c-bea7-49ce4ba127f8,timestamp:1707790425
2024-02-13T02:13:45,374 [INFO ] W-9002-densenet161_1.0-stdout org.pytorch.serve.wlm.WorkerLifeCycle - result=[METRICS]PredictionTime.Milliseconds:188.95|#ModelName:densenet161,Level:Model|#type:GAUGE|#hostname:ip-172-31-11-40,1707790425,e7140df4-7ba2-460c-bea7-49ce4ba127f8, pattern=[METRICS]
2024-02-13T02:13:45,374 [INFO ] W-9002-densenet161_1.0-stdout MODEL_METRICS - PredictionTime.ms:188.95|#ModelName:densenet161,Level:Model|#hostname:ip-172-31-11-40,requestID:e7140df4-7ba2-460c-bea7-49ce4ba127f8,timestamp:1707790425
2024-02-13T02:13:45,374 [INFO ] W-9002-densenet161_1.0 ACCESS_LOG - /127.0.0.1:59782 "PUT /predictions/densenet161 HTTP/1.1" 200 192
2024-02-13T02:13:45,374 [INFO ] W-9002-densenet161_1.0 TS_METRICS - Requests2XX.Count:1.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790425
2024-02-13T02:13:45,374 [INFO ] W-9002-densenet161_1.0 TS_METRICS - ts_inference_latency_microseconds.Microseconds:190581.0|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790425
2024-02-13T02:13:45,374 [INFO ] W-9002-densenet161_1.0 TS_METRICS - ts_queue_latency_microseconds.Microseconds:90.674|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790425
2024-02-13T02:13:45,374 [DEBUG] W-9002-densenet161_1.0 org.pytorch.serve.job.RestJob - Waiting time ns: 90674, Backend time ns: 191085536
2024-02-13T02:13:45,374 [INFO ] W-9002-densenet161_1.0 TS_METRICS - QueueTime.Milliseconds:0.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790425
2024-02-13T02:13:45,374 [INFO ] W-9002-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Backend response time: 191
2024-02-13T02:13:45,374 [INFO ] W-9002-densenet161_1.0 TS_METRICS - WorkerThreadTime.Milliseconds:0.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790425
2024-02-13T02:13:45,392 [INFO ] epollEventLoopGroup-3-7 TS_METRICS - ts_inference_requests_total.Count:1.0|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790425
2024-02-13T02:13:45,392 [DEBUG] W-9001-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Flushing req.cmd PREDICT repeats 1 to backend at: 1707790425392
2024-02-13T02:13:45,392 [INFO ] W-9001-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Looping backend response at: 1707790425392
2024-02-13T02:13:45,393 [INFO ] W-9001-densenet161_1.0-stdout MODEL_LOG - Backend received inference at: 1707790425
2024-02-13T02:13:45,582 [INFO ] W-9001-densenet161_1.0-stdout MODEL_LOG - TorchInductor FX Graph cache hit 1, FX Graph cache miss 0
2024-02-13T02:13:45,582 [INFO ] W-9001-densenet161_1.0-stdout org.pytorch.serve.wlm.WorkerLifeCycle - result=[METRICS]HandlerTime.Milliseconds:189.07|#ModelName:densenet161,Level:Model|#type:GAUGE|#hostname:ip-172-31-11-40,1707790425,a130efae-4cc2-4afb-bef3-a456422c9936, pattern=[METRICS]
2024-02-13T02:13:45,582 [INFO ] W-9001-densenet161_1.0-stdout MODEL_METRICS - HandlerTime.ms:189.07|#ModelName:densenet161,Level:Model|#hostname:ip-172-31-11-40,requestID:a130efae-4cc2-4afb-bef3-a456422c9936,timestamp:1707790425
2024-02-13T02:13:45,583 [INFO ] W-9001-densenet161_1.0-stdout org.pytorch.serve.wlm.WorkerLifeCycle - result=[METRICS]PredictionTime.Milliseconds:189.19|#ModelName:densenet161,Level:Model|#type:GAUGE|#hostname:ip-172-31-11-40,1707790425,a130efae-4cc2-4afb-bef3-a456422c9936, pattern=[METRICS]
2024-02-13T02:13:45,583 [INFO ] W-9001-densenet161_1.0 ACCESS_LOG - /127.0.0.1:59794 "PUT /predictions/densenet161 HTTP/1.1" 200 192
2024-02-13T02:13:45,583 [INFO ] W-9001-densenet161_1.0-stdout MODEL_METRICS - PredictionTime.ms:189.19|#ModelName:densenet161,Level:Model|#hostname:ip-172-31-11-40,requestID:a130efae-4cc2-4afb-bef3-a456422c9936,timestamp:1707790425
2024-02-13T02:13:45,583 [INFO ] W-9001-densenet161_1.0 TS_METRICS - Requests2XX.Count:1.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790425
2024-02-13T02:13:45,583 [INFO ] W-9001-densenet161_1.0 TS_METRICS - ts_inference_latency_microseconds.Microseconds:190693.955|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790425
2024-02-13T02:13:45,583 [INFO ] W-9001-densenet161_1.0 TS_METRICS - ts_queue_latency_microseconds.Microseconds:90.865|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790425
2024-02-13T02:13:45,583 [DEBUG] W-9001-densenet161_1.0 org.pytorch.serve.job.RestJob - Waiting time ns: 90865, Backend time ns: 191257983
2024-02-13T02:13:45,583 [INFO ] W-9001-densenet161_1.0 TS_METRICS - QueueTime.Milliseconds:0.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790425
2024-02-13T02:13:45,583 [INFO ] W-9001-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Backend response time: 191
2024-02-13T02:13:45,584 [INFO ] W-9001-densenet161_1.0 TS_METRICS - WorkerThreadTime.Milliseconds:0.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790425
2024-02-13T02:13:45,600 [INFO ] epollEventLoopGroup-3-8 TS_METRICS - ts_inference_requests_total.Count:1.0|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790425
2024-02-13T02:13:45,601 [DEBUG] W-9003-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Flushing req.cmd PREDICT repeats 1 to backend at: 1707790425601
2024-02-13T02:13:45,601 [INFO ] W-9003-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Looping backend response at: 1707790425601
2024-02-13T02:13:45,602 [INFO ] W-9003-densenet161_1.0-stdout MODEL_LOG - Backend received inference at: 1707790425
2024-02-13T02:13:45,792 [INFO ] W-9003-densenet161_1.0-stdout MODEL_LOG - TorchInductor FX Graph cache hit 1, FX Graph cache miss 0
2024-02-13T02:13:45,792 [INFO ] W-9003-densenet161_1.0-stdout org.pytorch.serve.wlm.WorkerLifeCycle - result=[METRICS]HandlerTime.Milliseconds:190.19|#ModelName:densenet161,Level:Model|#type:GAUGE|#hostname:ip-172-31-11-40,1707790425,11ae1157-1f73-4c24-8dbf-403c414556be, pattern=[METRICS]
2024-02-13T02:13:45,792 [INFO ] W-9003-densenet161_1.0-stdout MODEL_METRICS - HandlerTime.ms:190.19|#ModelName:densenet161,Level:Model|#hostname:ip-172-31-11-40,requestID:11ae1157-1f73-4c24-8dbf-403c414556be,timestamp:1707790425
2024-02-13T02:13:45,792 [INFO ] W-9003-densenet161_1.0-stdout org.pytorch.serve.wlm.WorkerLifeCycle - result=[METRICS]PredictionTime.Milliseconds:190.31|#ModelName:densenet161,Level:Model|#type:GAUGE|#hostname:ip-172-31-11-40,1707790425,11ae1157-1f73-4c24-8dbf-403c414556be, pattern=[METRICS]
2024-02-13T02:13:45,792 [INFO ] W-9003-densenet161_1.0-stdout MODEL_METRICS - PredictionTime.ms:190.31|#ModelName:densenet161,Level:Model|#hostname:ip-172-31-11-40,requestID:11ae1157-1f73-4c24-8dbf-403c414556be,timestamp:1707790425
2024-02-13T02:13:45,792 [INFO ] W-9003-densenet161_1.0 ACCESS_LOG - /127.0.0.1:59796 "PUT /predictions/densenet161 HTTP/1.1" 200 192
2024-02-13T02:13:45,793 [INFO ] W-9003-densenet161_1.0 TS_METRICS - Requests2XX.Count:1.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790425
2024-02-13T02:13:45,793 [INFO ] W-9003-densenet161_1.0 TS_METRICS - ts_inference_latency_microseconds.Microseconds:191822.021|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790425
2024-02-13T02:13:45,793 [INFO ] W-9003-densenet161_1.0 TS_METRICS - ts_queue_latency_microseconds.Microseconds:101.705|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790425
2024-02-13T02:13:45,793 [DEBUG] W-9003-densenet161_1.0 org.pytorch.serve.job.RestJob - Waiting time ns: 101705, Backend time ns: 192322626
2024-02-13T02:13:45,793 [INFO ] W-9003-densenet161_1.0 TS_METRICS - QueueTime.Milliseconds:0.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790425
2024-02-13T02:13:45,793 [INFO ] W-9003-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Backend response time: 191
2024-02-13T02:13:45,793 [INFO ] W-9003-densenet161_1.0 TS_METRICS - WorkerThreadTime.Milliseconds:1.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790425
2024-02-13T02:13:51,571 [INFO ] epollEventLoopGroup-3-9 TS_METRICS - ts_inference_requests_total.Count:1.0|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790431
2024-02-13T02:13:51,571 [DEBUG] W-9000-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Flushing req.cmd PREDICT repeats 1 to backend at: 1707790431571
2024-02-13T02:13:51,571 [INFO ] W-9000-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Looping backend response at: 1707790431571
2024-02-13T02:13:51,573 [INFO ] W-9000-densenet161_1.0-stdout MODEL_LOG - Backend received inference at: 1707790431
2024-02-13T02:13:51,581 [INFO ] W-9000-densenet161_1.0-stdout MODEL_LOG - TorchInductor FX Graph cache hit 0, FX Graph cache miss 1
2024-02-13T02:13:51,586 [INFO ] W-9000-densenet161_1.0-stdout org.pytorch.serve.wlm.WorkerLifeCycle - result=[METRICS]HandlerTime.Milliseconds:13.01|#ModelName:densenet161,Level:Model|#type:GAUGE|#hostname:ip-172-31-11-40,1707790431,78b10acb-45a9-4ed1-81af-d7ba5dcd261a, pattern=[METRICS]
2024-02-13T02:13:51,586 [INFO ] W-9000-densenet161_1.0-stdout MODEL_METRICS - HandlerTime.ms:13.01|#ModelName:densenet161,Level:Model|#hostname:ip-172-31-11-40,requestID:78b10acb-45a9-4ed1-81af-d7ba5dcd261a,timestamp:1707790431
2024-02-13T02:13:51,586 [INFO ] W-9000-densenet161_1.0-stdout org.pytorch.serve.wlm.WorkerLifeCycle - result=[METRICS]PredictionTime.Milliseconds:13.11|#ModelName:densenet161,Level:Model|#type:GAUGE|#hostname:ip-172-31-11-40,1707790431,78b10acb-45a9-4ed1-81af-d7ba5dcd261a, pattern=[METRICS]
2024-02-13T02:13:51,586 [INFO ] W-9000-densenet161_1.0-stdout MODEL_METRICS - PredictionTime.ms:13.11|#ModelName:densenet161,Level:Model|#hostname:ip-172-31-11-40,requestID:78b10acb-45a9-4ed1-81af-d7ba5dcd261a,timestamp:1707790431
2024-02-13T02:13:51,586 [INFO ] W-9000-densenet161_1.0 ACCESS_LOG - /127.0.0.1:34910 "PUT /predictions/densenet161 HTTP/1.1" 200 16
2024-02-13T02:13:51,586 [INFO ] W-9000-densenet161_1.0 TS_METRICS - Requests2XX.Count:1.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790431
2024-02-13T02:13:51,587 [INFO ] W-9000-densenet161_1.0 TS_METRICS - ts_inference_latency_microseconds.Microseconds:15124.556|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790431
2024-02-13T02:13:51,587 [INFO ] W-9000-densenet161_1.0 TS_METRICS - ts_queue_latency_microseconds.Microseconds:109.196|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790431
2024-02-13T02:13:51,587 [DEBUG] W-9000-densenet161_1.0 org.pytorch.serve.job.RestJob - Waiting time ns: 109196, Backend time ns: 15609920
2024-02-13T02:13:51,587 [INFO ] W-9000-densenet161_1.0 TS_METRICS - QueueTime.Milliseconds:0.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790431
2024-02-13T02:13:51,587 [INFO ] W-9000-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Backend response time: 15
2024-02-13T02:13:51,587 [INFO ] W-9000-densenet161_1.0 TS_METRICS - WorkerThreadTime.Milliseconds:1.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790431
2024-02-13T02:13:51,608 [INFO ] epollEventLoopGroup-3-10 TS_METRICS - ts_inference_requests_total.Count:1.0|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790431
2024-02-13T02:13:51,608 [DEBUG] W-9002-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Flushing req.cmd PREDICT repeats 1 to backend at: 1707790431608
2024-02-13T02:13:51,609 [INFO ] W-9002-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Looping backend response at: 1707790431609
2024-02-13T02:13:51,609 [INFO ] W-9002-densenet161_1.0-stdout MODEL_LOG - Backend received inference at: 1707790431
2024-02-13T02:13:51,619 [INFO ] W-9002-densenet161_1.0-stdout MODEL_LOG - TorchInductor FX Graph cache hit 1, FX Graph cache miss 0
2024-02-13T02:13:51,623 [INFO ] W-9002-densenet161_1.0-stdout org.pytorch.serve.wlm.WorkerLifeCycle - result=[METRICS]HandlerTime.Milliseconds:13.65|#ModelName:densenet161,Level:Model|#type:GAUGE|#hostname:ip-172-31-11-40,1707790431,e5565e47-83c5-4363-b594-dbf5170aa8a1, pattern=[METRICS]
2024-02-13T02:13:51,623 [INFO ] W-9002-densenet161_1.0-stdout MODEL_METRICS - HandlerTime.ms:13.65|#ModelName:densenet161,Level:Model|#hostname:ip-172-31-11-40,requestID:e5565e47-83c5-4363-b594-dbf5170aa8a1,timestamp:1707790431
2024-02-13T02:13:51,623 [INFO ] W-9002-densenet161_1.0-stdout org.pytorch.serve.wlm.WorkerLifeCycle - result=[METRICS]PredictionTime.Milliseconds:13.75|#ModelName:densenet161,Level:Model|#type:GAUGE|#hostname:ip-172-31-11-40,1707790431,e5565e47-83c5-4363-b594-dbf5170aa8a1, pattern=[METRICS]
2024-02-13T02:13:51,624 [INFO ] W-9002-densenet161_1.0 ACCESS_LOG - /127.0.0.1:34918 "PUT /predictions/densenet161 HTTP/1.1" 200 16
2024-02-13T02:13:51,624 [INFO ] W-9002-densenet161_1.0-stdout MODEL_METRICS - PredictionTime.ms:13.75|#ModelName:densenet161,Level:Model|#hostname:ip-172-31-11-40,requestID:e5565e47-83c5-4363-b594-dbf5170aa8a1,timestamp:1707790431
2024-02-13T02:13:51,624 [INFO ] W-9002-densenet161_1.0 TS_METRICS - Requests2XX.Count:1.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790431
2024-02-13T02:13:51,624 [INFO ] W-9002-densenet161_1.0 TS_METRICS - ts_inference_latency_microseconds.Microseconds:15205.979|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790431
2024-02-13T02:13:51,624 [INFO ] W-9002-densenet161_1.0 TS_METRICS - ts_queue_latency_microseconds.Microseconds:101.895|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790431
2024-02-13T02:13:51,624 [DEBUG] W-9002-densenet161_1.0 org.pytorch.serve.job.RestJob - Waiting time ns: 101895, Backend time ns: 15782358
2024-02-13T02:13:51,624 [INFO ] W-9002-densenet161_1.0 TS_METRICS - QueueTime.Milliseconds:0.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790431
2024-02-13T02:13:51,624 [INFO ] W-9002-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Backend response time: 14
2024-02-13T02:13:51,625 [INFO ] W-9002-densenet161_1.0 TS_METRICS - WorkerThreadTime.Milliseconds:2.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790431
2024-02-13T02:13:51,641 [INFO ] epollEventLoopGroup-3-11 TS_METRICS - ts_inference_requests_total.Count:1.0|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790431
2024-02-13T02:13:51,642 [DEBUG] W-9001-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Flushing req.cmd PREDICT repeats 1 to backend at: 1707790431642
2024-02-13T02:13:51,642 [INFO ] W-9001-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Looping backend response at: 1707790431642
2024-02-13T02:13:51,643 [INFO ] W-9001-densenet161_1.0-stdout MODEL_LOG - Backend received inference at: 1707790431
2024-02-13T02:13:51,652 [INFO ] W-9001-densenet161_1.0-stdout MODEL_LOG - TorchInductor FX Graph cache hit 1, FX Graph cache miss 0
2024-02-13T02:13:51,656 [INFO ] W-9001-densenet161_1.0-stdout org.pytorch.serve.wlm.WorkerLifeCycle - result=[METRICS]HandlerTime.Milliseconds:13.47|#ModelName:densenet161,Level:Model|#type:GAUGE|#hostname:ip-172-31-11-40,1707790431,00c4fb63-1ea9-495d-8a24-408affdad474, pattern=[METRICS]
2024-02-13T02:13:51,657 [INFO ] W-9001-densenet161_1.0-stdout MODEL_METRICS - HandlerTime.ms:13.47|#ModelName:densenet161,Level:Model|#hostname:ip-172-31-11-40,requestID:00c4fb63-1ea9-495d-8a24-408affdad474,timestamp:1707790431
2024-02-13T02:13:51,657 [INFO ] W-9001-densenet161_1.0-stdout org.pytorch.serve.wlm.WorkerLifeCycle - result=[METRICS]PredictionTime.Milliseconds:13.58|#ModelName:densenet161,Level:Model|#type:GAUGE|#hostname:ip-172-31-11-40,1707790431,00c4fb63-1ea9-495d-8a24-408affdad474, pattern=[METRICS]
2024-02-13T02:13:51,657 [INFO ] W-9001-densenet161_1.0 ACCESS_LOG - /127.0.0.1:34932 "PUT /predictions/densenet161 HTTP/1.1" 200 16
2024-02-13T02:13:51,657 [INFO ] W-9001-densenet161_1.0-stdout MODEL_METRICS - PredictionTime.ms:13.58|#ModelName:densenet161,Level:Model|#hostname:ip-172-31-11-40,requestID:00c4fb63-1ea9-495d-8a24-408affdad474,timestamp:1707790431
2024-02-13T02:13:51,657 [INFO ] W-9001-densenet161_1.0 TS_METRICS - Requests2XX.Count:1.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790431
2024-02-13T02:13:51,657 [INFO ] W-9001-densenet161_1.0 TS_METRICS - ts_inference_latency_microseconds.Microseconds:15067.833|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790431
2024-02-13T02:13:51,657 [INFO ] W-9001-densenet161_1.0 TS_METRICS - ts_queue_latency_microseconds.Microseconds:88.335|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790431
2024-02-13T02:13:51,657 [DEBUG] W-9001-densenet161_1.0 org.pytorch.serve.job.RestJob - Waiting time ns: 88335, Backend time ns: 15664092
2024-02-13T02:13:51,658 [INFO ] W-9001-densenet161_1.0 TS_METRICS - QueueTime.Milliseconds:0.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790431
2024-02-13T02:13:51,658 [INFO ] W-9001-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Backend response time: 15
2024-02-13T02:13:51,658 [INFO ] W-9001-densenet161_1.0 TS_METRICS - WorkerThreadTime.Milliseconds:1.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790431
2024-02-13T02:13:51,674 [INFO ] epollEventLoopGroup-3-12 TS_METRICS - ts_inference_requests_total.Count:1.0|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790431
2024-02-13T02:13:51,675 [DEBUG] W-9003-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Flushing req.cmd PREDICT repeats 1 to backend at: 1707790431675
2024-02-13T02:13:51,675 [INFO ] W-9003-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Looping backend response at: 1707790431675
2024-02-13T02:13:51,676 [INFO ] W-9003-densenet161_1.0-stdout MODEL_LOG - Backend received inference at: 1707790431
2024-02-13T02:13:51,685 [INFO ] W-9003-densenet161_1.0-stdout MODEL_LOG - TorchInductor FX Graph cache hit 1, FX Graph cache miss 0
2024-02-13T02:13:51,689 [INFO ] W-9003-densenet161_1.0-stdout org.pytorch.serve.wlm.WorkerLifeCycle - result=[METRICS]HandlerTime.Milliseconds:13.57|#ModelName:densenet161,Level:Model|#type:GAUGE|#hostname:ip-172-31-11-40,1707790431,ecb34ff8-6bd0-450e-b587-044588820f7d, pattern=[METRICS]
2024-02-13T02:13:51,690 [INFO ] W-9003-densenet161_1.0-stdout MODEL_METRICS - HandlerTime.ms:13.57|#ModelName:densenet161,Level:Model|#hostname:ip-172-31-11-40,requestID:ecb34ff8-6bd0-450e-b587-044588820f7d,timestamp:1707790431
2024-02-13T02:13:51,690 [INFO ] W-9003-densenet161_1.0-stdout org.pytorch.serve.wlm.WorkerLifeCycle - result=[METRICS]PredictionTime.Milliseconds:13.68|#ModelName:densenet161,Level:Model|#type:GAUGE|#hostname:ip-172-31-11-40,1707790431,ecb34ff8-6bd0-450e-b587-044588820f7d, pattern=[METRICS]
2024-02-13T02:13:51,690 [INFO ] W-9003-densenet161_1.0 ACCESS_LOG - /127.0.0.1:34940 "PUT /predictions/densenet161 HTTP/1.1" 200 16
2024-02-13T02:13:51,690 [INFO ] W-9003-densenet161_1.0-stdout MODEL_METRICS - PredictionTime.ms:13.68|#ModelName:densenet161,Level:Model|#hostname:ip-172-31-11-40,requestID:ecb34ff8-6bd0-450e-b587-044588820f7d,timestamp:1707790431
2024-02-13T02:13:51,690 [INFO ] W-9003-densenet161_1.0 TS_METRICS - Requests2XX.Count:1.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790431
2024-02-13T02:13:51,690 [INFO ] W-9003-densenet161_1.0 TS_METRICS - ts_inference_latency_microseconds.Microseconds:15120.785|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790431
2024-02-13T02:13:51,690 [INFO ] W-9003-densenet161_1.0 TS_METRICS - ts_queue_latency_microseconds.Microseconds:87.964|#model_name:densenet161,model_version:default|#hostname:ip-172-31-11-40,timestamp:1707790431
2024-02-13T02:13:51,690 [DEBUG] W-9003-densenet161_1.0 org.pytorch.serve.job.RestJob - Waiting time ns: 87964, Backend time ns: 15640141
2024-02-13T02:13:51,690 [INFO ] W-9003-densenet161_1.0 TS_METRICS - QueueTime.Milliseconds:0.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790431
2024-02-13T02:13:51,691 [INFO ] W-9003-densenet161_1.0 org.pytorch.serve.wlm.WorkerThread - Backend response time: 15
2024-02-13T02:13:51,691 [INFO ] W-9003-densenet161_1.0 TS_METRICS - WorkerThreadTime.Milliseconds:1.0|#Level:Host|#hostname:ip-172-31-11-40,timestamp:1707790431

Checklist:

Did you have fun?
Have you added tests that prove your fix is effective or that this feature works?
Has code been commented, particularly in hard-to-understand areas?
Have you made corresponding changes to the documentation?

msaroufim · 2024-02-02T20:42:51Z

examples/pt2/torch_inductor_caching/caching_handler.py

+        self.manifest = ctx.manifest
+        properties = ctx.system_properties
+
+        if (


I'm not sure I understand the point of this PR? Why add a layer of indirection to set a torch config via the torchserve yaml config when I can just directly set an environment variable?

EDIT: Ah actually since you're using os.environ this will introduce some config isolation which is useful

Yes, that is the idea.

Have you also tested this for TS with multiple models? Any downside of setting Environment variable for model specific config yaml for other workers on TS? ie if two workers tried to set different values will that work?

I haven't tried multi model, but updated the example to be a multi-worker example.

msaroufim

do you know if pytorch core will log a line to say the cache was hit? Might be useful for people to debug

examples/pt2/torch_inductor_caching/caching_handler.py

examples/pt2/torch_inductor_caching/model-config-fx-cache.yaml

agunapal · 2024-02-02T23:03:33Z

do you know if pytorch core will log a line to say the cache was hit? Might be useful for people to debug

Unfortunately, no.
https://github.com/pytorch/pytorch/blob/main/torch/_inductor/compile_fx.py#L418-L427

msaroufim · 2024-02-02T23:40:53Z

So I'd recommend at least adding some debug statement after building pytorch from source so you're sure things work. MIght as well upstream that too

chauhang

@ankithagunapal Great to see the speed with the cache. Let's also verify for multiple workers.

Will be good to also reference these articles for additional tips for reducing / debugging compile time issues:

https://pytorch.org/blog/training-production-ai-models/#34-controlling-just-in-time-compilation-time

https://pytorch.org/docs/stable/torch.compiler_profiling_torch_compile.html

…pytorch/serve into examples/torch_inductor_caching

agunapal · 2024-02-13T02:37:55Z

So I'd recommend at least adding some debug statement after building pytorch from source so you're sure things work. MIght as well upstream that too

@msaroufim There are counters. I added this logic in the handler

# Debugs for FX Graph Cache hit
if torch._inductor.config.fx_graph_cache:
    logger.info(
        f'TorchInductor FX Graph cache hit {counters["inductor"]["fxgraph_cache_hit"]}, FX Graph cache miss {counters["inductor"]["fxgraph_cache_miss"]}'
    )

agunapal · 2024-02-13T02:44:50Z

https://pytorch.org/docs/stable/torch.compiler_profiling_torch_compile.html

Modified the example to work with multiple workers. And added a section for additional links you mentioned. @chauhang Merging this PR for now.

#2925 (comment)

agunapal added 2 commits February 2, 2024 20:01

example for using torhcinductor caching

dd8c84f

example for using torhcinductor caching

f6d8476

agunapal requested review from msaroufim and mreso February 2, 2024 20:05

agunapal added 3 commits February 2, 2024 20:12

example for using torhcinductor caching

f5b024c

update README

86dd56b

update README

817a30e

msaroufim requested changes Feb 2, 2024

View reviewed changes

msaroufim approved these changes Feb 2, 2024

View reviewed changes

msaroufim reviewed Feb 2, 2024

View reviewed changes

examples/pt2/torch_inductor_caching/caching_handler.py Outdated Show resolved Hide resolved

msaroufim reviewed Feb 2, 2024

View reviewed changes

examples/pt2/torch_inductor_caching/model-config-fx-cache.yaml Outdated Show resolved Hide resolved

chauhang previously requested changes Feb 3, 2024

View reviewed changes

agunapal and others added 4 commits February 3, 2024 00:28

review comments

d627a09

updated readme

daeb3b6

Merge branch 'master' into examples/torch_inductor_caching

33c2f9c

Merge branch 'examples/torch_inductor_caching' of https://github.com/…

155b2bb

…pytorch/serve into examples/torch_inductor_caching

agunapal changed the title ~~example for using TorchInductor caching with torch.compile~~ (WIP)example for using TorchInductor caching with torch.compile Feb 12, 2024

agunapal added 2 commits February 13, 2024 02:23

Verified with 4 workers

9ae93f1

verified with 4 workers

c6e4f76

added additional links for debugging

e1fc360

agunapal changed the title ~~(WIP)example for using TorchInductor caching with torch.compile~~ example for using TorchInductor caching with torch.compile Feb 13, 2024

agunapal requested a review from chauhang February 13, 2024 02:48

agunapal added this pull request to the merge queue Feb 13, 2024

Merged via the queue into master with commit bef3b63 Feb 13, 2024
15 checks passed

agunapal deleted the examples/torch_inductor_caching branch February 14, 2024 01:29

chauhang added this to the v0.10.0 milestone Feb 27, 2024

agunapal mentioned this pull request Feb 27, 2024

Add caching support for PT2 compile #2912

Closed

agunapal added the torch.compile label Jun 28, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

example for using TorchInductor caching with torch.compile #2925

example for using TorchInductor caching with torch.compile #2925

agunapal commented Feb 2, 2024 •

edited

Loading

msaroufim Feb 2, 2024 •

edited

Loading

agunapal Feb 2, 2024

chauhang Feb 3, 2024

agunapal Feb 13, 2024

msaroufim left a comment

agunapal commented Feb 2, 2024

msaroufim commented Feb 2, 2024 •

edited

Loading

chauhang left a comment

agunapal commented Feb 13, 2024

agunapal commented Feb 13, 2024 •

edited

Loading

example for using TorchInductor caching with torch.compile #2925

example for using TorchInductor caching with torch.compile #2925

Conversation

agunapal commented Feb 2, 2024 • edited Loading

Description

Type of change

Feature/Issue validation/testing

Checklist:

msaroufim Feb 2, 2024 • edited Loading

Choose a reason for hiding this comment

agunapal Feb 2, 2024

Choose a reason for hiding this comment

chauhang Feb 3, 2024

Choose a reason for hiding this comment

agunapal Feb 13, 2024

Choose a reason for hiding this comment

msaroufim left a comment

Choose a reason for hiding this comment

agunapal commented Feb 2, 2024

msaroufim commented Feb 2, 2024 • edited Loading

chauhang left a comment

Choose a reason for hiding this comment

agunapal commented Feb 13, 2024

agunapal commented Feb 13, 2024 • edited Loading

agunapal commented Feb 2, 2024 •

edited

Loading

msaroufim Feb 2, 2024 •

edited

Loading

msaroufim commented Feb 2, 2024 •

edited

Loading

agunapal commented Feb 13, 2024 •

edited

Loading