#

quantization-aware-training

Here are 42 public repositories matching this topic...

intel / neural-compressor

SOTA low-bit LLM quantization (INT8/FP8/INT4/FP4/NF4) & sparsity; leading model compression techniques on TensorFlow, PyTorch, and ONNX Runtime

sparsity pruning quantization knowledge-distillation auto-tuning int8 low-precision quantization-aware-training post-training-quantization awq int4 large-language-models gptq smoothquant sparsegpt fp4 mxformat

Updated Dec 18, 2024
Python

666DZY666 / micronet

micronet, a model compression and deploy lib. compression: 1、quantization: quantization-aware-training(QAT), High-Bit(>2b)(DoReFa/Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference)、Low-Bit(≤2b)/Ternary and Binary(TWN/BNN/XNOR-Net); post-training-quantization(PTQ), 8-bit(tensorrt); 2、 pruning: normal、reg…

Updated Oct 6, 2021
Python

openvinotoolkit / nncf

Neural Network Compression Framework for enhanced OpenVINO™ inference

nlp sparsity compression deep-learning tensorflow transformers pytorch classification pruning object-detection quantization semantic-segmentation bert onnx openvino mixed-precision-training quantization-aware-training llm genai

Updated Dec 18, 2024
Python

alibaba / TinyNeuralNetwork

TinyNeuralNetwork is an efficient and easy-to-use deep learning model compression framework.

deep-neural-networks deep-learning pytorch pruning model-compression model-converter quantization-aware-training post-training-quantization

Updated Dec 12, 2024
Python

SpursLipu / YOLOv3v4-ModelCompression-MultidatasetTraining-Multibackbone

YOLO ModelCompression MultidatasetTraining

yolo pruning object-detection modelcompression mobilenetv3 quantization-aware-training multidataset

Updated Jun 21, 2022
Python

megvii-research / Sparsebit

A model compression and acceleration toolbox based on pytorch.

deep-learning sparse pruning quantization tensorrt quantization-aware-training post-training-quantization

Updated Jan 12, 2024
Python

Beomi / BitNet-Transformers

0️⃣1️⃣🤗 BitNet-Transformers: Huggingface Transformers Implementation of "BitNet: Scaling 1-bit Transformers for Large Language Models" in pytorch with Llama(2) Architecture

transformers quantization quantization-aware-training llm

Updated Mar 17, 2024
Python

THU-MIG / torch-model-compression

针对pytorch模型的自动化模型结构分析和修改工具集，包含自动分析模型结构的模型压缩算法库

pytorch pruning quantization tensorrt model-compression qat onnx reparameterization tensorrt-conversion quantization-aware-training acnet

Updated Apr 19, 2023
Python

clovaai / frostnet

FrostNet: Towards Quantization-Aware Network Architecture Search

computer-vision deep-learning pytorch style-transfer classification object-detection quantization network-architecture semantic-segmentation optimizers quantization-aware-training int8-quantization post-quantization quantization-efficient-network

Updated May 3, 2024
Python

openvinotoolkit / mmdetection

OpenVINO Training Extensions Object Detection

sparsity compression computer-vision deep-learning pytorch ssd faster-rcnn object-detection instance-segmentation mask-rcnn retinanet onnx openvino cascade-rcnn fcos onnxruntime atss quantization-aware-training nncf

Updated Mar 8, 2023
Python

jahongir7174 / YOLOv8-qat

Quantization Aware Training

python pytorch object-detection int8-inference quantization-aware-training int8-quantization yolov8

Updated Jan 13, 2024
Python

mlzxy / qsparse

Train neural networks with joint quantization and pruning on both weights and activations using any pytorch modules

neural-network pytorch pruning model-compression quantization-aware-training

Updated Sep 19, 2022
Python

jeshraghian / QSNNs

Quantization-aware training with spiking neural networks

deep-learning neuroscience networks spiking-neural-networks quantization backpropagation neural snn spiking quantization-aware-training

Updated Feb 18, 2022
Python

yashbhalgat / QualcommAI-MicroNet-submission-MixNet

3rd place solution for NeurIPS 2019 MicroNet challenge

competition quantization mixnet model-pruning model-compression neurips-2019 micronet-challenge unstructured-pruning quantization-aware-training

Updated Nov 8, 2019
Python

saqibjaved1 / QT-DoG

QT-DOG: QUANTIZATION-AWARE TRAINING FOR DOMAIN GENERALIZATION

deep-neural-networks compression ensemble resnet-50 domain-generalization quantization-aware-training vision-transformer

Updated Oct 10, 2024
Python

HaoranREN / TensorFlow_Model_Quantization

A tutorial of model quantization using TensorFlow

machine-learning tensorflow tensorflow-lite tflite model-quantization inference-efficiency quantization-aware-training

Updated Aug 2, 2021
Python

rishivar / Resnet-18

Image classification done with Mindspore technology

cifar-10 resnet18 mindspore quantization-aware-training

Updated Jan 24, 2021
Python

Intelligent-Microsystems-Lab / SNNQuantPrune

Code for the ISCAS23 paper "The Hardware Impact of Quantization and Pruning for Weights in Spiking Neural Networks"

machine-learning sparsity deep-learning spiking-neural-networks quantization snn quantization-aware-training

Updated Apr 20, 2023
Python

HanByulKim / BASQ

BASQ: Branch-wise Activation-clipping Search Quantization for Sub-4-bit Neural Networks, ECCV 2022

pytorch quantization neural-architecture-search quantization-aware-training eccv2022

Updated Oct 24, 2022
Python

motokimura / pytorch_quantization_fx

An example to quantize MobileNetV2 trained on CIFAR-10 dataset with PyTorch FX graph mode quantization

pytorch quantization cifar10 mobilenetv2 quantization-aware-training post-training-quantization pytorch-fx-graph-mode-quantization

Updated Oct 29, 2024
Python

Improve this page

Add a description, image, and links to the quantization-aware-training topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the quantization-aware-training topic, visit your repo's landing page and select "manage topics."