Meme Trojan: Backdoor Attacks Against Hateful Meme Detection via Cross-Modal Triggers

Setup

python==3.7
mmf==1.0.0rc12
torch==1.11.0
torchvision==0.12.0
pytorch_lightning==1.6.0
timm==0.9.12
diffusers==0.21.4
numpy==1.21.4
easyocr==1.7.1

Quickstart

Dataset download: FBHM, MAMI, HarMeme. For your custom dataset, please refer to MMF Dataset
Data poisoning:

python sample.py # randomly sample \rho percent of memes for poisoning.
python poison.py # initialized trigger injection (CMT w.o. TA).
python augmentor.py # train the augmentor
python trigger.py # inject the final CMT
# The final poisoned text can be recognized by OCR tools (https://gitlab.com/api4ai/examples/ocr).

Training the victim model

mmf_run config=projects/hateful_memes/configs/visual_bert/defaults.yaml \
    datasets=hateful_memes \
    model=visual_bert \
    run_type=train_val

Evaluation

mmf_predict config=projects/hateful_memes/configs/visual_bert/defaults.yaml \
    datasets=hateful_memes \
    model=visual_bert \
    run_type=test \ 
    checkpoint.resume_file=./save/visual_bert_final.pth \
    checkpoint.resume_pretrained=False

Citation

If you use our Meme Trojan in your work, please cite:

@inproceedings{wang2025meme,
  title={Meme Trojan: Backdoor Attacks Against Hateful Meme Detection via Cross-Modal Triggers},
  author={Wang, Ruofei and Lin, Hongzhan and Luo, Ziyuan and Cheung, Ka Chun and See, Simon and Ma, Jing and Wan, Renjie},
  booktitle={Proc. AAAI},
  volume={39},
  number={8},
  pages={7844--7852},
  year={2025}
}

Acknowledgement

Thanks to MMF, which is a modular framework for vision and language multimodal research from Facebook AI Research. See full list of project inside or built on MMF here.

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
Reports		Reports
docs		docs
easyocr		easyocr
img		img
mmf.egg-info		mmf.egg-info
mmf		mmf
mmf_cli		mmf_cli
projects		projects
tests		tests
tools		tools
website		website
LICENSE		LICENSE
MANIFEST.in		MANIFEST.in
NOTICES		NOTICES
PACKAGE		PACKAGE
README.md		README.md
augmentor.py		augmentor.py
poison.py		poison.py
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt
sample.py		sample.py
setup.py		setup.py
trigger.py		trigger.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Meme Trojan: Backdoor Attacks Against Hateful Meme Detection via Cross-Modal Triggers

Setup

Quickstart

Citation

Acknowledgement

About

Uh oh!

Releases

Packages

Uh oh!

Languages

License

rfww/CMTMEME

Folders and files

Latest commit

History

Repository files navigation

Meme Trojan: Backdoor Attacks Against Hateful Meme Detection via Cross-Modal Triggers

Setup

Quickstart

Citation

Acknowledgement

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages