GitHub - Syeda-Farhat/awesome-Transformers-For-Segmentation: Semantic segmentation is an important job in computer vision, and its applications have grown in popularity over the last decade.We grouped the publications that used various forms of segmentation in this repository. Particularly, every paper is built on a transformer.

Transfomers For Segmentation

The suggested list is a compendium of works that use Transformer-Based Segmentation techniques for Semantic and Instance Segmentation of image or video datasets.

Contribution

You can add to this repository; we would be grateful. Please feel free to send me pull requests

The structure that we'll use:

[Paper Name] (link) -Conference Name and Year -[github] (link)

Papers
- Survey Papers
- 2023
  - ICCV 2023
  - CVPR 2023
  - WACV 2023
  - IEEE 2023
  - MDPI 2023
  - arXiv 2023
- 2022
  - CVPR 2022
  - WACV 2022
  - NIPs 2022
  - IEEE 2022
  - MDPI 2022
  - arXiv 2022
- 2021
  - CVPR 2021
  - ICCV 2021
  - NIPs 2021
  - MICCIA 2021
  - MDPI 2021
  - IEEE 2021
  - arXiv 2021
- 2020
- 2019
  - IEEE 2019
  - arXiv 2019
- Others
- Acknowledgements
- Citation

Papers

Survey Papers

A Survey of Transformers -arXiv 2021.
Transformers in Vision: A Survey -arXiv 2021.
Transformers in computational visual media: A survey -SpringerLink 2022.
A Survey on Vision Transformer -IEEE 2022.
Vision Transformers in Medical Computer Vision - A Contemplative Retrospection -arXiv 2022.
Recent Advances in Vision Transformer: A Survey and Outlook of Recent Work -arXiv 2022.
3D Vision with Transformers: A Survey -arXiv 2022.
A Survey on Graph Neural Networks and Graph Transformers in Computer Vision: A Task-Oriented Perspective -arXiv 2022.
VISION TRANSFORMERS FOR ACTION RECOGNITION: A SURVEY -arXiv 2022.
Vision transformers for dense prediction: A survey -ELSEVIER 2022.
Semantic segmentation using Vision Transformers: A survey -ELSEVIER 2023.
A Comprehensive Survey of Transformers for Computer Vision -MDPI 2023.
Transformers in Remote Sensing: A Survey -MDPI 2023.
A Survey of Visual Transformers -IEEE 2023.
Transformer-Based Visual Segmentation: A Survey -IEEE 2024.

2023

2022

CVPR 2022

Multi-class Token Transformer for Weakly Supervised Semantic Segmentation -CVPR 2022 -[github]
TopFormer: Token Pyramid Transformer for Mobile Semantic Segmentation -CVPR 2022 -github
Masked-attention Mask Transformer for Universal Image Segmentation -CVPR 2022 -github
Temporally Efficient Vision Transformer for Video Instance Segmentation -CVPR 2022 -github
An MIL-Derived Transformer for Weakly Supervised Point Cloud Segmentation -CVPR 2022 -[github]
Multi-Scale High-Resolution Vision Transformer for Semantic Segmentation -CVPR 2022 -github
MPViT : Multi-Path Vision Transformer for Dense Prediction -CVPR 2022 -[github]

WACV 2022

Unetr: Transformers for 3d medical image segmentation -WACV 2022 -github
AFTer-UNet: Axial Fusion Transformer UNet for Medical Image Segmentation -WACV 2022 -[github]
Spatial-Temporal Transformer for 3D Point Cloud Sequences -WACV 2022 -[github]

NIPs 2022

SegViT: Semantic Segmentation with Plain Vision Transformerss -NIPs 2022 -github
Intermediate Prototype Mining Transformer for Few-Shot Semantic Segmentation -NIPs 2022 -[github]
RTFormer: Efficient Design for Real-Time Semantic Segmentation with Transformer -NIPs 2022 -[github]

IEEE 2022

Swin Transformer Embedding UNet for Remote Sensing Image Semantic Segmentation -IEEE 2022 -[github]
Transformer and CNN Hybrid Deep Neural Network for Semantic Segmentation of Very-high-resolution Remote Sensing Imagery -IEEE 2022 -[github]
A novel transformer based semantic segmentation scheme for fine-resolution remote sensing images -IEEE 2022 -[github]
LFT-Net: Local Feature Transformer Network for Point Clouds Analysis -IEEE 2022 -[github]
Transformer-based Efficient Salient Instance Segmentation Networks with Orientative Query --Code
Bird's-Eye-View Panoptic Segmentation Using Monocular Frontal View Images -IEEE 2022 -[github]
Looking Outside the Window: Wide-Context Transformer for the Semantic Segmentation of High-Resolution Remote Sensing Images -IEEE 2022 -[github]

MDPI 2022

Enhanced Feature Pyramid Vision Transformer for Semantic Segmentation on Thailand Landsat-8 Corpus -MDPI 2022 -[github]

arXiv 2022

Pyramid fusion transformer for semantic segmentation -arXiv 2022 -[github]
TransBTSV2: Wider Instead of Deeper Transformer for Medical Image Segmentation -arXiv 2022 -github
Swin UNETR: Swin Transformers for Semantic Segmentation of Brain Tumors in MRI Images -arXiv 2022 -[github]
Task-Adaptive Feature Transformer with Semantic Enrichment for Few-Shot Segmentation -arXiv 2022 -github
Inverted Pyramid Multi-task Transformer for Dense Scene Understanding -arXiv 2022 -github

2021

CVPR 2021

MaX-DeepLab: End-to-End Panoptic Segmentation With Mask Transformers -CVPR 2021 -github
End-to-End Video Instance Segmentation With Transformers -CVPR 2021 -github
Rethinking Semantic Segmentation from a Sequence-to-Sequence Perspective with Transformers -CVPR 2021 -github
Sstvos: Sparse spatiotemporal transformers for video object segmentation -CVPR 2021 -github
Locate then Segment: A Strong Pipeline for Referring Image Segmentation -CVPR 2021 -[github]

ICCV 2021

Pyramid Vision Transformer: A Versatile Backbone for Dense Prediction without Convolutions -ICCV 2021 -github
Pyramid Vision Transformer: A Versatile Backbone for Dense Prediction without Convolutions — Supplemental Materials -ICCV 2021 -[github]
Joint Inductive and Transductive Learning for Video Object Segmentation -ICCV 2021 -github
Swin Transformer: Hierarchical Vision Transformer using Shifted Windows -ICCV 2021 -github
Self-supervised Video Object Segmentation by Motion Grouping -ICCV 2021 -github
Vision Transformers for Dense Prediction -ICCV 2021 -github
Point Transformer -ICCV 2021 -github
SOTR: Segmenting Objects with Transformers -ICCV 2021 -github
A Unified Efficient Pyramid Transformer for Semantic Segmentation -ICCV 2021 -github
Multi-Scale Vision Longformer: A New Vision Transformer for High-Resolution Image Encoding -ICCV 2021 -github
Simpler is Better: Few-shot Semantic Segmentation with Classifier Weight Transformer -ICCV 2021 -github
Trans4Trans: Efficient Transformer for Transparent Object Segmentation to Help Visually Impaired People Navigate in the Real World -ICCV 2021 -[github]
Vision-Language Transformer and Query Generation for Referring Segmentation -ICCV 2021 -github
Segmenter: Transformer for Semantic Segmentation -ICCV 2021 -github

NIPs 2021

Twins: Revisiting the Design of Spatial Attention in Vision Transformers -NIPs 2021 -github
HRFormer: High-Resolution Transformer for Dense Prediction -NIPs 2021 -github
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transformers -NIPs 2021 -github
Per-Pixel Classification is Not All You Need for Semantic Segmentation -NIPs 2021 -github
Associating Objects with Transformers for Video Object Segmentation -NIPs 2021 -github
Video Instance Segmentation using Inter-Frame Communication Transformers -NIPs 2021 -github
Few-Shot Segmentation via Cycle-Consistent Transformer -NIPs 2021 -github

MICCIA 2021

Medical Transformer: Gated Axial-Attention for Medical Image Segmentation -MICCIA 2021 -github
UTNet: A Hybrid Transformer Architecture for Medical Image Segmentation -MICCIA 2021 -github
Transbts: Multimodal brain tumor segmentation using transformer -MICCIA 2021 -github
Multi-compound transformer for accurate biomedical image segmentation -MICCIA 2021 -[github]
A multi-branch hybrid transformer network for corneal endothelial cell segmentation -MICCIA 2021 -[github]
DC-Net: Dual Context Network for 2D Medical Image Segmentation -MICCIA 2021 -[github]
Transfuse: Fusing transformers and cnns for medical image segmentation -MICCIA 2021 -github
Teds-net: Enforcing diffeomorphisms in spatial transformers to guarantee topology preservation in segmentations -MICCIA 2021 -[github]
Cotr: Efficiently bridging cnn and transformer for 3d medical image segmentation -MICCIA 2021 -github
Boundary-aware transformers for skin lesion segmentation -MICCIA 2021 -github
Convolution-Free Medical Image Segmentation using Transformers -MICCIA 2021 -[github]

MDPI 2021

Transformer Meets Convolution: A Bilateral Awareness Network for Semantic Segmentation of Very Fine Resolution Urban Scene Images -MDPI 2021 -[github]
Wildfire Segmentation Using Deep Vision Transformers -MDPI 2021 -[github]
Transformer-Based Decoder Designs for Semantic Segmentation on Remotely Sensed Images -MDPI 2021 -github
Efficient Transformer for Remote Sensing Image Segmentation -MDPI 2021 -github

IEEE 2021

Segmentation applying TAG type label data and Transformer -IEEE 2021 -[github]
Local Memory Attention for Fast Video Semantic Segmentation --IEEE 2021 -[github]
A Transformer-Based Feature Segmentation and Region Alignment Method For UAV-View Geo-Localization -IEEE 2021 -[github]
STransFuse: Fusing Swin Transformer and Convolutional Neural Network for Remote Sensing Image Semantic Segmentation -IEEE 2021 -[github]
Swin-Spectral Transformer for Cholangiocarcinoma Hyperspectral Image Segmentation -IEEE 2021 -[github]
ECT-NAS: Searching Efficient CNN-Transformers Architecture for Medical Image Segmentation -IEEE 2021 -[github]
3D Deep Attentive U-Net with Transformer for Breast Tumor Segmentation from Automated Breast Volume Scanner -IEEE 2021 -[github]
Visual-Semantic Transformer for Face Forgery Detection -IEEE 2021 -[github]
MaAST: Map Attention with Semantic Transformers for Efficient Visual Navigation -IEEE 2021 -[github]
Multi-scale Hierarchical Transformer structure for 3D medical image segmentation -IEEE 2021 -[github]
A Temporary Transformer Network for Guide- Wire Segmentation -IEEE 2021 -[github]
A Transformer-Based Network for Anisotropic 3D Medical Image Segmentation -IEEE 2021 -[github]

arXiv 2021

OffRoadTranSeg: Semi-Supervised Segmentation using Transformers on OffRoad environments -arXiv 2021 -[github]
Multi-Scale High-Resolution Vision Transformer for Semantic Segmentation -arXiv 2021 -github
Self-Supervised Learning with Swin Transformers -arXiv 2021 -[github]
GT U-Net: A U-Net Like Group Transformer Network for Tooth Root Segmentation -arXiv 2021 -[github]
SpecTr: Spectral Transformer for Hyperspectral Pathology Image Segmentation -arXiv 2021 -[github]
Satellite Image Semantic Segmentation -arXiv 2021 -github
Boosting Few-shot Semantic Segmentation with Transformers -arXiv 2021 -[github]
Multi-Scale High-Resolution Vision Transformer for Semantic Segmentation -arXiv 2021 -github
A Robust Volumetric Transformer for Accurate 3D Tumor Segmentation -arXiv 2021 -github
Dynamic Convolution for 3D Point Cloud Instance Segmentation -arXiv 2021 -[github]
Fast Point Transformer -arXiv 2021 -github
ViTBIS: Vision Transformer for Biomedical Image Segmentation -arXiv 2021 -[github]
Fully Transformer Networks for Semantic Image Segmentation -arXiv 2021 -[github]
UNetFormer: A UNet-like Transformer for Efficient Semantic Segmentation of Remote Sensing Urban Scene Imagery -arXiv 2021 -[github]
Unsupervised Brain Anomaly Detection and Segmentation with Transformers -arXiv 2021 -[github]
few-Shot Temporal Action Localization with Query Adaptive Transformer -arXiv 2021 -github
Cost Aggregation Is All You Need for Few-Shot Segmentation -arXiv 2021 -[github]
Polyp-PVT: Polyp Segmentation with Pyramid Vision Transformers -arXiv 2021 -github
TransAttUnet: Multi-level Attention-guided U-Net with Transformer for Medical Image Segmentation -arXiv 2021 -[github]
ASFormer: Transformer for Action Segmentation -arXiv 2021 -github
TransClaw U-Net: Claw U-Net with Transformers for Medical Image Segmentation -arXiv 2021 -[github]
SeqFormer: Sequential Transformer for Video Instance Segmentation -arXiv 2021 -github
Mask2Former for Video Instance Segmentation -arXiv 2021 -github
Swin-Unet: Unet-like Pure Transformer for Medical Image Segmentation -arXiv 2021 -github
LeViT-UNet: Make Faster Encoders with Transformer for Medical Image Segmentation -arXiv 2021 -[github]
ISTR: End-to-End Instance Segmentation with Transformers -arXiv 2021 -github
P2T: Pyramid Pooling Transformer for Scene Understanding -arXiv 2021 -[github]
Medical Transformer: Universal Brain Encoder for 3D MRI Analysis -arXiv 2021 -[github]
nnFormer: Interleaved Transformer for Volumetric Segmentation -arXiv 2021 -[github]
MISSFormer: An Effective Medical Image Segmentation Transformer -arXiv 2021 -[github]
ViT-V-Net: Vision Transformer for Unsupervised Volumetric Medical Image Registration -arXiv 2021 -[github]
Pyramid Medical Transformer for Medical Image Segmentation -arXiv 2021 -[github]
U-Net Transformer: Self and Cross Attention for Medical Image Segmentation -arXiv 2021 -[github]
Ds-transunet: Dual swin transformer u-net for medical image segmentation -arXiv 2021 -[github]
TransUNet: Transformers Make Strong Encoders for Medical Image Segmentation -arXiv 2021 -github
TransVOS: Video Object Segmentation with Transformers -arXiv 2021 -[github]

2020

CVPR 2020

Polytransform: Deep polygon transformer for instance segmentation -CVPR 2020 -[github]
Sct: Set constrained temporal transformer for set supervised action segmentation -CVPR 2020 -github

ECCV 2020

Feature pyramid transformer -ECCV 2020 -github
End-to-end object detection with transformers -ECCV 2020 -github

MICCIA 2020

Multi-task Dynamic Transformer Network for Concurrent Bone Segmentation and Large-Scale Landmark Localization with Dental CBCT -MICCIA 2020 -[github]

IEEE 2020

Attention-Based Transformers for Instance Segmentation of Cells in Microstructures -IEEE 2020 -github
Detecting lane and road markings at a distance with perspective transformer layers -IEEE 2020 -[github]
Efficient aortic valve multilabel segmentation using a spatial transformer network -IEEE 2020 -[github]

arXiv 2020

Visual transformers: Token-based image representation and processing for computer vision -arXiv 2020 -github
Task-adaptive feature transformer for few-shot segmentation -arXiv 2020 -github

2019

IEEE 2019

TETRIS: Template transformer networks for image segmentation with shape priors -IEEE 2019 -[github]

arXiv 2019

Iterative transformer network for 3d point cloud -arXiv 2019 -github
Segmentation transformer: Object-contextual representations for semantic segmentation -arXiv 2019 -[github]

Others

TrSeg: Transformer for semantic segmentation -Pattern Recognition Letters 2021 -github
Video Semantic Segmentation via Sparse Temporal Transformer -ACM 2021 -[github]

Acknowledgements

We appreciate the excellent work of the authors mentioned above.

Name		Name	Last commit message	Last commit date
Latest commit History 65 Commits
README.md		README.md

Syeda-Farhat/awesome-Transformers-For-Segmentation

Folders and files

Latest commit

History

Repository files navigation

Transfomers For Segmentation

Contribution

Table of Contents

Papers

Survey Papers

2023

ICCV 2023

CVPR 2023

WACV 2023

IEEE 2023

MDPI 2023

arXiv 2023