Awesome-Mamba-in-Vision

List of papers related to State Space Models (Mamba) in Vision.

Table of Content

Foundational Work
Multi-Modal Methods
Perception Tasks
Video Understanding
3D Vision
Medical Imaging
Generation and Reconstructions

Foundational Work

HiPPO: Recurrent Memory with Optimal Polynomial Projections; Albert Gu, Tri Dao, Stefano Ermon, Atri Rudra, Christopher Re (Paper)
Efficiently Modeling Long Sequences with Structured State Spaces; Albert Gu, Karan Goel, Christopher Ré (Paper)
Mamba: Linear-Time Sequence Modeling with Selective State Spac; Albert Gu, Tri Dao (Paper)
Facing Off World Model Backbones: RNNs, Transformers, and S4; Fei Deng, Junyeong Park, Sungjin Ahn (Paper)
Vision Mamba: Efficient Visual Representation Learning with Bidirectional State Space Model; Lianghui Zhu, Bencheng Liao, Qian Zhang, Xinlong Wang, Wenyu Liu, Xinggang Wang (Paper)
Graph-Mamba: Towards Long-Range Graph Sequence Modeling with Selective State Spaces; Chloe Wang, Oleksii Tsepa, Jun Ma, Bo Wang (Paper, Code)
Is Mamba Capable of In-Context Learning?; Riccardo Grazzi, Julien Siems, Simon Schrodi, Thomas Brox, Frank Hutter (Paper)
The Hidden Attention of Mamba Models; Ameen Ali, Itamar Zimerman, Lior Wolf (Paper, Code)
Graph Mamba: Towards Learning on Graphs with State Space Models; Ali Behrouz, Farnoosh Hashemi (Paper, Code)
The pitfalls of next-token prediction; Gregor Bachmann, Vaishnavh Nagarajan (Paper, Code)
Theoretical Foundations of Deep Selective State-Space Models; Nicola Muca Cirone, Antonio Orvieto, Benjamin Walker, Cristopher Salvi, Terry Lyons (Paper)
Can Mamba Learn How to Learn? A Comparative Study on In-Context Learning Tasks; Jongho Park, Jaeseung Park, Zheyang Xiong, Nayoung Lee, Jaewoong Cho, Samet Oymak, Kangwook Lee, Dimitris Papailiopoulos (Paper)
BlackMamba: Mixture of Experts for State-Space Models; Quentin Anthony, Yury Tokpanov, Paolo Glorioso, Beren Millidge (Paper, Code)
STG-Mamba: Spatial-Temporal Graph Learning via Selective State Space Model; Lincan Li, Hanchen Wang, Wenjie Zhang, Adelle Coster (Paper)
Is Mamba Effective for Time Series Forecasting?; Zihan Wang, Fanheng Kong, Shi Feng, Ming Wang, Han Zhao, Daling Wang, Yifei Zhang (Paper, Code)
On the low-shot transferability of [V]-Mamba; Diganta Misra, Jay Gala, Antonio Orvieto (Paper)
EfficientVMamba: Atrous Selective Scan for Light Weight Visual Mamba; Xiaohuan Pei, Tao Huang, Chang Xu (Paper, Code)
TimeMachine: A Time Series is Worth 4 Mambas for Long-term Forecasting; Md Atik Ahamed, Qiang Cheng (Paper, Code)
LocalMamba: Visual State Space Model with Windowed Selective Scan; Tao Huang, Xiaohuan Pei, Shan You, Fei Wang, Chen Qian, Chang Xu (Paper, Code)

Multi-Modal Methods

Cobra: Extending Mamba to Multi-Modal Large Language Model for Efficient Inference; Han Zhao, Min Zhang, Wei Zhao, Pengxiang Ding, Siteng Huang, Donglin Wang (Paper, Code)
VL-Mamba: Exploring State Space Models for Multimodal Learning; Yanyuan Qiao, Zheng Yu, Longteng Guo, Sihan Chen, Zijia Zhao, Mingzhen Sun, Qi Wu, Jing Liu (Paper)

Perception Tasks

Pan-Mamba: Effective pan-sharpening with State Space Model; Xuanhua He, Ke Cao, Keyu Yan, Rui Li, Chengjun Xie, Jie Zhang, Man Zhou (Paper, Code)
Vision-RWKV: Efficient and Scalable Visual Perception with RWKV-Like Architectures; Yuchen Duan, Weiyun Wang, Zhe Chen, Xizhou Zhu, Lewei Lu, Tong Lu, Yu Qiao, Hongsheng Li, Jifeng Dai, Wenhai Wang (Paper, Code)
MiM-ISTD: Mamba-in-Mamba for Efficient Infrared Small Target Detection; Tianxiang Chen, Zhentao Tan, Tao Gong, Qi Chu, Yue Wu, Bin Liu, Jieping Ye, Nenghai Yu (Paper, Code)
Res-VMamba: Fine-Grained Food Category Visual Classification Using Selective State Space Models with Deep Residual Learning; Chi-Sheng Chen, Guan-Ying Chen, Dong Zhou, Di Jiang, Dai-Shi Chen (Paper, Code)
Motion-Guided Dual-Camera Tracker for Low-Cost Skill Evaluation of Gastric Endoscopy; Yuelin Zhang, Wanquan Yan, Kim Yan, Chun Ping Lam, Yufu Qiu, Pengyu Zheng, Raymond Shing-Yan Tang, Shing Shin Cheng (Paper)
MamMIL: Multiple Instance Learning for Whole Slide Images with State Space Models; Zijie Fang, Yifeng Wang, Zhi Wang, Jian Zhang, Xiangyang Ji, Yongbing Zhang (Paper)
Mamba-ND: Selective State Space Modeling for Multi-Dimensional Data; Shufan Li, Harkanwar Singh, Aditya Grover (Paper)
MiM-ISTD: Mamba-in-Mamba for Efficient Infrared Small Target Detection; Tianxiang Chen, Zhentao Tan, Tao Gong, Qi Chu, Yue Wu, Bin Liu, Jieping Ye, Nenghai Yu (Paper, Code)
ProMamba: Prompt-Mamba for polyp segmentation; Jianhao Xie, Ruofan Liao, Ziang Zhang, Sida Yi, Yuesheng Zhu, Guibo Luo (Paper)

Video Understanding

VideoMamba: State Space Model for Efficient Video Understanding; Kunchang Li, Xinhao Li, Yi Wang, Yinan He, Yali Wang, Limin Wang, Yu Qiao (Paper, Code)
Mamba-ND: Selective State Space Modeling for Multi-Dimensional Data; Shufan Li, Harkanwar Singh, Aditya Grover (Paper)
Video Mamba Suite: State Space Model as a Versatile Alternative for Video Understanding; Guo Chen, Yifei Huang, Jilan Xu, Baoqi Pei, Zhe Chen, Zhiqi Li, Jiahao Wang, Kunchang Li, Tong Lu, Limin Wang (Paper, Code)

3D Vision

PointMamba: A Simple State Space Model for Point Cloud Analysis; Dingkang Liang, Xin Zhou, Xinyu Wang, Xingkui Zhu, Wei Xu, Zhikang Zou, Xiaoqing Ye, Xiang Bai (Paper, Code)
nnMamba: 3D Biomedical Image Segmentation, Classification and Landmark Detection with State Space Model; Haifan Gong, Luoyao Kang, Yitao Wang, Xiang Wan, Haofeng Li (Paper, Code)
Point Could Mamba: Point Cloud Learning via State Space Model; Tao Zhang, Xiangtai Li, Haobo Yuan, Shunping Ji, Shuicheng Yan (Paper, Code)
Motion Mamba: Efficient and Long Sequence Motion Generation with Hierarchical and Bidirectional Selective SSM; Zeyu Zhang, Akide Liu, Ian Reid, Richard Hartley, Bohan Zhuang, Hao Tang (Paper, Code)
Point Mamba: A Novel Point Cloud Backbone Based on State Space Model with Octree-Based Ordering Strategy; Jiuming Liu, Ruiji Yu, Yian Wang, Yu Zheng, Tianchen Deng, Weicai Ye, Hesheng Wang (Paper, Code)

Medical Imaging

VM-UNet: Vision Mamba UNet for Medical Image Segmentation; Jiacheng Ruan, Suncheng Xiang (Paper, Code)
Vivim: a Video Vision Mamba for Medical Video Object Segmentation; Yijun Yang, Zhaohu Xing, Chunwang Huang, Lei Zhu (Paper, Code)
Swin-UMamba: Mamba-based UNet with ImageNet-based pretraining; Jiarun Liu, Hao Yang, Hong-Yu Zhou, Yan Xi, Lequan Yu, Yizhou Yu, Yong Liang, Guangming Shi, Shaoting Zhang, Hairong Zheng, Shanshan Wang (Paper, Code)
Semi-Mamba-UNet: Pixel-Level Contrastive Cross-Supervised Visual Mamba-based UNet for Semi-Supervised Medical Image Segmentation; Ziyang Wang, Chao Ma (Paper, Code)
MedMamba: Vision Mamba for Medical Image Classification; Yubiao Yue, Zhenzhang Li (Paper, Code)
Weak-Mamba-UNet: Visual Mamba Makes CNN and ViT Work Better for Scribble-based Medical Image Segmentation; Ziyang Wang, Chao Ma (Paper, Code)
P-Mamba: Marrying Perona Malik Diffusion with Mamba for Efficient Pediatric Echocardiographic Left Ventricular Segmentation; Zi Ye, Tianxiang Chen (Paper)
Large Window-based Mamba UNet for Medical Image Segmentation: Beyond Convolution and Self-attention; Jinhong Wang, Jintai Chen, Danny Chen, Jian Wu (Paper, Code)
LightM-UNet: Mamba Assists in Lightweight UNet for Medical Image Segmentation; Weibin Liao, Yinghao Zhu, Xinyuan Wang, Chengwei Pan, Yasha Wang, Liantao Ma (Paper, Code)
MambaMIR: An Arbitrary-Masked Mamba for Joint Medical Image Reconstruction and Uncertainty Estimation; Jiahao Huang, Liutao Yang, Fanwen Wang, Yinzhe Wu, Yang Nan, Angelica I. Aviles-Rivero, Carola-Bibiane Schönlieb, Daoqiang Zhang, Guang Yang (Paper, Code)
FD-Vision Mamba for Endoscopic Exposure Correction; Zhuoran Zheng, Jun Zhang (Paper, Code)
Mamba-UNet: UNet-Like Pure Visual Mamba for Medical Image Segmentation; Ziyang Wang, Jian-Qing Zheng, Yichi Zhang, Ge Cui, Lei Li (Paper, Code)
MambaMorph: a Mamba-based Framework for Medical MR-CT Deformable Registration; Tao Guo, Yinuo Wang, Shihao Shu, Diansheng Chen, Zhouping Tang, Cai Meng, Xiangzhi Bai (Paper, Code)
SegMamba: Long-range Sequential Modeling Mamba For 3D Medical Image Segmentation; Zhaohu Xing, Tian Ye, Yijun Yang, Guang Liu, Lei Zhu (Paper, Code)
U-Mamba: Enhancing Long-range Dependency for Biomedical Image Segmentation; Jun Ma, Feifei Li, Bo Wang (Paper, Code)
MedMamba: Vision Mamba for Medical Image Classification; Yubiao Yue, Zhenzhang Li (Paper, Code)
MambaMIR: An Arbitrary-Masked Mamba for Joint Medical Image Reconstruction and Uncertainty Estimation; Jiahao Huang, Liutao Yang, Fanwen Wang, Yinzhe Wu, Yang Nan, Angelica I. Aviles-Rivero, Carola-Bibiane Schönlieb, Daoqiang Zhang, Guang Yang (Paper, Code)
P-Mamba: Marrying Perona Malik Diffusion with Mamba for Efficient Pediatric Echocardiographic Left Ventricular Segmentation; Zi Ye, Tianxiang Chen, Fangyijie Wang, Hanwei Zhang, Guanxi Li, Lijun Zhang (Paper)
H-vmunet: High-order Vision Mamba UNet for Medical Image Segmentation; Renkai Wu, Yinghao Liu, Pengchen Liang, Qing Chang (Paper, Code)
VM-UNET-V2 Rethinking Vision Mamba UNet for Medical Image Segmentation; Mingya Zhang, Yue Yu, Limei Gu, Tingsheng Lin, Xianping Tao (Paper, Code)
MD-Dose: A Diffusion Model based on the Mamba for Radiotherapy Dose Prediction; Linjie Fu, Xia Li, Xiuding Cai, Yingkai Wang, Xueyao Wang, Yali Shen, Yu Yao (Paper)

Generation and Reconstructions

Scalable Diffusion Models with State Space Backbone; Zhengcong Fei, Mingyuan Fan, Changqian Yu, Junshi Huang (Paper, Code)
MambaIR: A Simple Baseline for Image Restoration with State-Space Model; Hang Guo, Jinmin Li, Tao Dai, Zhihao Ouyang, Xudong Ren, Shu-Tao Xia (Paper, Code)
Motion Mamba: Efficient and Long Sequence Motion Generation with Hierarchical and Bidirectional Selective SSM; Zeyu Zhang, Akide Liu, Ian Reid, Richard Hartley, Bohan Zhuang, Hao Tang (Paper, Code)
U-shaped Vision Mamba for Single Image Dehazing; Zhuoran Zheng, Chen Wu (Paper, Code)
ZigMa: Zigzag Mamba Diffusion Model; Vincent Tao Hu, Stefan Andreas Baumann, Ming Gui, Olga Grebenkova, Pingchuan Ma, Johannes Fischer, Bjorn Ommer (Paper, Code)
MambaTalk: Efficient Holistic Gesture Synthesis with Selective State Space Models; Zunnan Xu, Yukang Lin, Haonan Han, Sicheng Yang, Ronghui Li, Yachao Zhang, Xiu Li (Paper)
Activating Wider Areas in Image Super-Resolution; Cheng Cheng, Hang Wang, Hongbin Sun (Paper)

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Awesome-Mamba-in-Vision

Table of Content

Foundational Work

Multi-Modal Methods

Perception Tasks

Video Understanding

3D Vision

Medical Imaging

Generation and Reconstructions

About

Releases

Packages

License

vgthengane/Awesome-Mamba-in-Vision

Folders and files

Latest commit

History

Repository files navigation

Awesome-Mamba-in-Vision

Table of Content

Foundational Work

Multi-Modal Methods

Perception Tasks

Video Understanding

3D Vision

Medical Imaging

Generation and Reconstructions

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Packages