[tokenizer] Ensure GPU is used in TextEmbeddingTranslator #3212

david-sitsky · 2024-05-22T07:20:34Z

This fixes #3211, where using djl://ai.djl.huggingface.pytorch/sentence-transformers/clip-ViT-B-32-multilingual-v1 on 0.28.0 fails on a GPU machine with:

Caused by: ai.djl.engine.EngineException: Expected all tensors to be on the same device, but found at least two devices, cuda:0 and cpu! (when checking argument for argument mat2 in method wrapper_mm)
	at ai.djl.pytorch.jni.PyTorchLibrary.torchNNLinear(PyTorchLibrary.java) ~[pytorch-engine-0.28.0.jar:?]
	at ai.djl.pytorch.jni.JniUtils.linear(JniUtils.java:1376) ~[pytorch-engine-0.28.0.jar:?]
	at ai.djl.pytorch.engine.PtNDArrayEx.linear(PtNDArrayEx.java:397) ~[pytorch-engine-0.28.0.jar:?]
	at ai.djl.huggingface.translator.TextEmbeddingTranslator.processEmbedding(TextEmbeddingTranslator.java:181) ~[tokenizers-0.28.0.jar:?]
	at ai.djl.huggingface.translator.TextEmbeddingTranslator.batchProcessOutput(TextEmbeddingTranslator.java:144) ~[tokenizers-0.28.0.jar:?]
	at ai.djl.inference.Predictor.batchPredict(Predictor.java:190) ~[api-0.28.0.jar:?]
	at ai.djl.inference.Predictor.predict(Predictor.java:132) ~[api-0.28.0.jar:?]

Ensure GPU is used if the manager is configured that way.

a52099c

david-sitsky requested review from zachgk, frankfliu and a team as code owners May 22, 2024 07:20

frankfliu approved these changes May 22, 2024

View reviewed changes

Remove unused import

b1ac932

frankfliu merged commit d3fd000 into deepjavalibrary:master May 22, 2024
5 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[tokenizer] Ensure GPU is used in TextEmbeddingTranslator #3212

[tokenizer] Ensure GPU is used in TextEmbeddingTranslator #3212

david-sitsky commented May 22, 2024

[tokenizer] Ensure GPU is used in TextEmbeddingTranslator #3212

[tokenizer] Ensure GPU is used in TextEmbeddingTranslator #3212

Conversation

david-sitsky commented May 22, 2024