Skip to content

Optimized versions TensorFlow and TensorFlow-GPU for specific CPUs and GPUs (for both old and new).

Notifications You must be signed in to change notification settings

dbklim/optimized_tensorflow_wheels

Repository files navigation

Optimized TensorFlow wheels

Репозиторий предназначен для хранения собранных с помощью данного docker-образа оптимизированных версий TensorFlow и TensorFlow-GPU v1.13.1-1.15.2 под конкретные CPU (для повышения производительности на новых CPU и возможности запуска на старых CPU).

Все собранные версии TensorFlow и TensorFlow-GPU v1.13.1-1.15.2 хранятся в моём Google Drive.

Сборка выполнялась в ОС Ubuntu 19.10 с Python 3.6-3.7, с поддержкой XLA и без поддержки Intel MKL-DNN. TensorFlow-GPU требует CUDA 10.0-10.2 и cuDNN 7.6, при сборке было указано Compute Capability 6.1, 7.0 и 7.5.

Имя CPU Supported Instructions GPU
tensorflow_cpu_ALL_XLA-1.15.2-cp37-cp37m-linux_x86_64.whl Intel Xeon Silver 4214 SSE4.1, SSE4.2, AVX, AVX2, AVX512F, FMA
tensorflow_gpu_ALL_cuda10.0_XLA-1.15.2-cp37-cp37m-linux_x86_64.whl Intel Xeon Silver 4214 SSE4.1, SSE4.2, AVX, AVX2, AVX512F, FMA NVIDIA Tesla T4 (CUDA 10.0, cuDNN 7.6.5)
tensorflow_gpu_ALL_cuda10.2_XLA-1.15.2-cp37-cp37m-linux_x86_64.whl Intel Xeon Silver 4214 SSE4.1, SSE4.2, AVX, AVX2, AVX512F, FMA NVIDIA Tesla T4 (CUDA 10.2, cuDNN 7.6.5)
tensorflow_cpu_noAVX512F_XLA-1.15.2-cp37-cp37m-linux_x86_64.whl Intel Core i7-10510U SSE4.1, SSE4.2, AVX, AVX2, FMA
tensorflow_gpu_noAVX512F_cuda10.0_XLA-1.15.2-cp37-cp37m-linux_x86_64.whl Intel Core i7-10510U SSE4.1, SSE4.2, AVX, AVX2, FMA NVIDIA GeForce MX250 (CUDA 10.0, cuDNN 7.6.5)
tensorflow_gpu_noAVX512F_cuda10.2_XLA-1.15.2-cp37-cp37m-linux_x86_64.whl Intel Core i7-10510U SSE4.1, SSE4.2, AVX, AVX2, FMA NVIDIA GeForce MX250 (CUDA 10.2, cuDNN 7.6.5)
tensorflow_cpu_SSE4.1_SSE4.2_XLA-1.15.2-cp37-cp37m-linux_x86_64.whl Intel Xeon X5650 SSE4.1, SSE4.2
tensorflow_gpu_SSE4.1_SSE4.2_cuda10.0_XLA-1.15.2-cp37-cp37m-linux_x86_64.whl Intel Xeon X5650 SSE4.1, SSE4.2 NVIDIA GeForce RTX2080 (CUDA 10.0, cuDNN 7.6.5)
tensorflow_gpu_SSE4.1_SSE4.2_cuda10.2_XLA-1.15.2-cp37-cp37m-linux_x86_64.whl Intel Xeon X5650 SSE4.1, SSE4.2 NVIDIA GeForce RTX2080 (CUDA 10.2, cuDNN 7.6.5)
tensorflow_cpu_noALL_XLA-1.15.2-cp37-cp37m-linux_x86_64.whl KVM Processor
tensorflow_i7_8700-1.13.1-cp36-cp36m-linux_x86_64.whl Intel Core i7-8700 SSE4.1, SSE4.2, AVX, AVX2, FMA
tensorflow_i7_8700_GeForceGTX1070-1.13.1-cp36-cp36m-linux_x86_64.whl Intel Core i7-8700 SSE4.1, SSE4.2, AVX, AVX2, FMA NVIDIA GeForce GTX1070 (CUDA 10.0, cuDNN 7.5)
tensorflow_E3_1270-1.13.1-cp36-cp36m-linux_x86_64.whl Intel Xeon E3-1270 v3 SSE4.1, SSE4.2, AVX, AVX2
tensorflow_X5650-1.13.2-cp36-cp36m-linux_x86_64.whl Intel Xeon X5650 SSE4.1, SSE4.2
tensorflow_X5650_GeForceRTX2080-1.13.2-cp36-cp36m-linux_x86_64.whl Intel Xeon X5650 SSE4.1, SSE4.2 NVIDIA GeForce RTX2080 (CUDA 10.0, cuDNN 7.5)

Варианты установки

  1. Загрузить нужную версию вручную и установить с помощью pip:
pip3 install wheel_name.whl
  1. Выбрать нужную версию, скопировать ссылку на неё, загрузить скриптом download_file_from_google_drive.sh и установить с помощью pip (загруженный файл после установки можно удалить):
./download_file_from_google_drive.sh "link_to_wheel"
pip3 install wheel_name.whl
rm wheel_name.whl

Например, версия tensorflow_cpu_noALL_XLA-1.15.2-cp37-cp37m-linux_x86_64.whl:

./download_file_from_google_drive.sh "https://drive.google.com/open?id=1lC_8Zl2SYXWwHWq0IsS-N_MeoctW7FH4"
pip3 install tensorflow_cpu_noALL_XLA-1.15.2-cp37-cp37m-linux_x86_64.whl
rm tensorflow_cpu_noALL_XLA-1.15.2-cp37-cp37m-linux_x86_64.whl
  1. Использовать скрипт для автоматического определения, загрузки и установки подходящей версии install_optimized_tensorflow_v1.15.2.sh:
./install_optimized_tensorflow_v1.15.2.sh [-mkl|-gpu]

Данный скрипт определяет поддерживаемые текущим CPU инструкции, версию Python и CUDA, выбирает наиболее подходящую версию TensorFlow, загружает её из папки в Google Drive и устанавливает. Если подходящей версии TensorFlow не найдено, будет установлена версия из pip.

Скрипт принимает несколько аргументов:

  • -mkl: загрузить и установить версию с поддержкой Intel MKL-DNN
  • -gpu: загрузить и установить версию с поддержкой GPU

Другие версии TensorFlow от сообщества

В репозитории tensorflow-community-wheels можно найти намного больше различных версий TensorFlow и TensorFlow-GPU, собранных другими участниками сообщества.


Если у вас возникнут вопросы или вы хотите сотрудничать, можете написать мне на почту: vladsklim@gmail.com или в LinkedIn.

Releases

No releases published

Packages

No packages published

Languages