GitHub - movinghoon/DTEM: [NeurIPS 24] Learning to Merge Tokens via Decoupled Embedding for Efficient Vision Transformers

Learning to Merge Tokens via Decoupled Embedding for Efficient Vision Transformers

This repository contains official code for
Learning to Merge Tokens via Decoupled Embedding for Efficient Vision Transformers
Dong Hoon Lee and Seunghoon Hong NeurIPS 2024

Requirements

torch==2.0.1
timm==0.9.7
tqdm, wandb, einops We also include environment.yaml for conda environment.

Basic usage

Modular training with DeiT-small on ImageNet-1k:

torchrun --nproc_per_node 8 train.py \
    --arch deit-small \
    --data-dir $DATA_DIR \
    --name $NAME \
    --entity $ENTITY \ 
    --project $PROJECT

Citation

If you find our work useful, please consider citing it:

@inproceedings{
    lee2024dtem,
    title={Learning to Merge Tokens via Decoupled Embedding for Efficient Vision Transformers},
    author={Dong Hoon Lee and Seunghoon Hong},
    booktitle={Conference on Neural Information Processing Systems},
    year={2024},
}

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
data		data
dtem		dtem
model		model
src		src
.gitignore		.gitignore
README.md		README.md
dtem.png		dtem.png
environment.yaml		environment.yaml
requirements.txt		requirements.txt
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Learning to Merge Tokens via Decoupled Embedding for Efficient Vision Transformers

Requirements

Basic usage

Citation

About

Uh oh!

Releases

Packages

Languages

movinghoon/DTEM

Folders and files

Latest commit

History

Repository files navigation

Learning to Merge Tokens via Decoupled Embedding for Efficient Vision Transformers

Requirements

Basic usage

Citation

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages