Analysis of contingency of feedback

Data created using this preprocessing script.

Train classifier for clarification requests

python train_cf_classifier.py --data_path data/CR_manual_annotations.csv --target_column is_cr --model_name_or_path microsoft/deberta-v3-xsmall --output_dir models/cr_classifier

Annotate data

python annotate_cf.py --model models/cr_classifier/checkpoint-395 --target_column is_cr

Create results plot

python create_feedback_contingency_results_plot.py

Analysis of effects of caregiver feedback on grammar learning

Train LM Baseline

python train_lm.py fit --trainer.devices [0] --trainer.accelerator gpu --trainer.logger=WandbLogger --trainer.logger.name baseline

Train reward model

python train_ppo_reward_model.py --model_name_or_path microsoft/deberta-v3-xsmall --output_dir reward_modeling_test

Train topline reward model

python train_ppo_reward_model.py --model_name_or_path microsoft/deberta-v3-xsmall --output_dir reward_model_topline --data_paths ~/data/babylm_data/evaluation_data/blimp_filtered_childes/ ~/data/babylm_data/evaluation_data/zorro_filtered_childes/

Finetune LM using PPO

python train_ppo.py --policy_model lightning_logs/kqb5kj4z/ckpt_huggingface_best --value_model reward_model/checkpoint-900

Visualizations

python create_results_visualizations.py

To use the precomputed baseline stats as reference:

python create_results_visualizations.py --results_file results/results_baselines.csv

Visalizations for topline:

python create_results_visualizations.py --plot_comparison_model_2 Topline

Name		Name	Last commit message	Last commit date
Latest commit History 539 Commits
childes-grammaticality @ 6bee9d2		childes-grammaticality @ 6bee9d2
data		data
evaluation-pipeline-2024 @ 03ebd81		evaluation-pipeline-2024 @ 03ebd81
results		results
.gitignore		.gitignore
.gitmodules		.gitmodules
README.md		README.md
annotate_cf.py		annotate_cf.py
annotate_grammaticality.py		annotate_grammaticality.py
annotate_grammaticality_caregiver_utts.py		annotate_grammaticality_caregiver_utts.py
check_correlation_reward_models.py		check_correlation_reward_models.py
convert_zorro_babylm.py		convert_zorro_babylm.py
create_additional_train_datasets.py		create_additional_train_datasets.py
create_feedback_contingency_results_plot.py		create_feedback_contingency_results_plot.py
create_ppo_training_sample_utts.py		create_ppo_training_sample_utts.py
create_results_visualizations.py		create_results_visualizations.py
data.py		data.py
environment.yml		environment.yml
environment_cpu.yml		environment_cpu.yml
eval.py		eval.py
filter_blimp_and_zorro.py		filter_blimp_and_zorro.py
model.py		model.py
train_cf_classifier.py		train_cf_classifier.py
train_lm.py		train_lm.py
train_ppo.py		train_ppo.py
train_ppo_reward_model.py		train_ppo_reward_model.py
utilities.py		utilities.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Analysis of contingency of feedback

Train classifier for clarification requests

Annotate data

Create results plot

Analysis of effects of caregiver feedback on grammar learning

Train LM Baseline

Train reward model

Train topline reward model

Finetune LM using PPO

Visualizations

Visalizations for topline:

About

Uh oh!

Releases

Packages

Languages

mitjanikolaus/lm_feedback

Folders and files

Latest commit

History

Repository files navigation

Analysis of contingency of feedback

Train classifier for clarification requests

Annotate data

Create results plot

Analysis of effects of caregiver feedback on grammar learning

Train LM Baseline

Train reward model

Train topline reward model

Finetune LM using PPO

Visualizations

Visalizations for topline:

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages