pruning

Here are 474 public repositories matching this topic...

datawhalechina / leedl-tutorial

《李宏毅深度学习教程》（李宏毅老师推荐👍，苹果书🍎），PDF下载地址：https://github.com/datawhalechina/leedl-tutorial/releases

machine-learning tutorial reinforcement-learning deep-learning cnn transformer gan rnn pruning transfer-learning bert diffusion self-attention network-compression chatgpt leedl-tutorial

Updated Dec 19, 2024
Jupyter Notebook

IntelLabs / distiller

Star

Neural Network Distiller by Intel AI Lab: a Python package for neural network compression research. https://intellabs.github.io/distiller

deep-neural-networks jupyter-notebook pytorch regularization pruning quantization group-lasso distillation onnx truncated-svd network-compression pruning-structures early-exit automl-for-compression

Updated Apr 24, 2023
Jupyter Notebook

neuralmagic / deepsparse

Star

Sparsity-aware deep learning inference runtime for CPUs

nlp performance computer-vision inference machinelearning pruning object-detection pretrained-models quantization cpus onnx sparsification llm-inference deepsparse

Updated Jul 19, 2024
Python

VainF / Torch-Pruning

Star

[CVPR 2023] DepGraph: Towards Any Structural Pruning

pruning model-compression channel-pruning network-pruning structured-pruning efficient-deep-learning depgraph structural-pruning cvpr2023

Updated Dec 21, 2024
Python

he-y / Awesome-Pruning

Star

A curated list of neural network pruning resources.

awesome-list pruning model-compression model-acceleration

Updated Apr 4, 2024

intel / neural-compressor

Star

SOTA low-bit LLM quantization (INT8/FP8/INT4/FP4/NF4) & sparsity; leading model compression techniques on TensorFlow, PyTorch, and ONNX Runtime

sparsity pruning quantization knowledge-distillation auto-tuning int8 low-precision quantization-aware-training post-training-quantization awq int4 large-language-models gptq smoothquant sparsegpt fp4 mxformat

Updated Dec 24, 2024
Python

micronet, a model compression and deploy lib. compression: 1、quantization: quantization-aware-training(QAT), High-Bit(>2b)(DoReFa/Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference)、Low-Bit(≤2b)/Ternary and Binary(TWN/BNN/XNOR-Net); post-training-quantization(PTQ), 8-bit(tensorrt); 2、 pruning: normal、reg…

Updated Oct 6, 2021
Python

quic / aimet

Star

AIMET is a library that provides advanced quantization and compression techniques for trained neural network models.

open-source machine-learning opensource deep-neural-networks compression deep-learning pruning quantization auto-ml network-quantization network-compression

Updated Dec 23, 2024
Python

neuralmagic / sparseml

Star

Libraries for applying sparsification recipes to neural networks with a few lines of code, enabling faster and smaller models

nlp sparsity tensorflow keras pytorch deep-learning-algorithms image-classification deep-learning-library pruning object-detection transfer-learning automl computer-vision-algorithms onnx deep-learning-models sparsification pruning-algorithms smaller-models sparsification-recipes

Updated Aug 1, 2024
Python

PaddlePaddle / PaddleSlim

Star

PaddleSlim is an open-source library for deep model compression and architecture search.

sparsity compression detection transformer segmentation pruning quantization nas bert tensorrt distillation ernie yolov5 yolov6 yolov7

Updated Dec 4, 2024
Python

open-mmlab / mmrazor

Star

OpenMMLab Model Compression Toolbox and Benchmark.

detection pytorch classification segmentation pruning darts quantization nas knowledge-distillation spos autoslim

Updated Jun 11, 2024
Python

tensorflow / model-optimization

Star

A toolkit to optimize ML models for deployment for Keras and TensorFlow, including quantization and pruning.

machine-learning sparsity compression deep-learning tensorflow optimization keras ml pruning quantization model-compression quantized-training quantized-neural-networks quantized-networks

Updated Dec 16, 2024
Python

cupcakearmy / autorestic

Sponsor

Star

Config driven, easy backup cli for restic.

config cli backup incremental pruning restic deduplication incremental-backup config-driven

Updated Nov 14, 2024
Go

huawei-noah / Efficient-Computing

Star

Efficient computing methods developed by Huawei Noah's Ark Lab

pruning quantization knowledge-distillation model-compression self-supervised binary-neural-networks

Updated Nov 5, 2024
Jupyter Notebook

openvinotoolkit / nncf

Star

Neural Network Compression Framework for enhanced OpenVINO™ inference

nlp sparsity compression deep-learning tensorflow transformers pytorch classification pruning object-detection quantization semantic-segmentation bert onnx openvino mixed-precision-training quantization-aware-training llm genai

Updated Dec 20, 2024
Python

horseee / LLM-Pruner

Star

[NeurIPS 2023] LLM-Pruner: On the Structural Pruning of Large Language Models. Support Llama-3/3.1, Llama-2, LLaMA, BLOOM, Vicuna, Baichuan, TinyLlama, etc.