[NMT] Add support for multiple validation and test dataloaders #2113

ericharper · 2021-04-24T21:01:26Z

Specify multiple validation (or test) dataloaders by inputting a list of src (tgt) files.

Usage

Replace src_file_name and tgt_file_name with a list of file paths.

    model.validation_ds.src_file_name=/data/wmt14-en-de.src \
    model.validation_ds.tgt_file_name=/data/wmt14-en-de.ref \

Becomes:

    model.validation_ds.src_file_name=[/data/wmt13-en-de.src,/data/wmt14-en-de.src] \
    model.validation_ds.tgt_file_name=[/data/wmt13-en-de.ref,/data/wmt14-en-de.ref] \

When using val_loss or val_sacreBLEU for the exp_manager.checkpoint_callback_params.monitor then the 0th indexed dataloader will be used as the monitor. This ensures backwards compatibility.

Additionally, any validation dataloader can now be used as a monitor by appending the index as below:

    exp_manager.checkpoint_callback_params.monitor=val_sacreBLEU_dl_index_1

Multiple test datasets works exactly the same way as validation datasets, simply replace validation_ds by test_ds in the above examples.

Signed-off-by: ericharper <[email protected]>

nemo/collections/nlp/data/machine_translation/machine_translation_dataset.py

Signed-off-by: ericharper <[email protected]>

okuchaiev

lgtm, let's wait a little to see what PTL teams says

Signed-off-by: ericharper <[email protected]>

…A#2113) * add multiple validation dataloaders Signed-off-by: ericharper <[email protected]> * loop over outputs in eval_epoch_end Signed-off-by: ericharper <[email protected]> * looping over val dataloaders in eval epoch end Signed-off-by: ericharper <[email protected]> * style Signed-off-by: ericharper <[email protected]> * add sync_dist Signed-off-by: ericharper <[email protected]> * rearrange name Signed-off-by: ericharper <[email protected]> * compute eval loss for each data loader Signed-off-by: ericharper <[email protected]> * set loss attr for each val dl Signed-off-by: ericharper <[email protected]> * set loss attr for each val dl Signed-off-by: ericharper <[email protected]> * default to dl index 0 Signed-off-by: ericharper <[email protected]> * default to dl index 0 Signed-off-by: ericharper <[email protected]> * clean up Signed-off-by: ericharper <[email protected]> * normalize one val dataset outputs Signed-off-by: ericharper <[email protected]> * add jenkins test for multi-val Signed-off-by: ericharper <[email protected]> * add multi-test Signed-off-by: ericharper <[email protected]> * add multi-test Signed-off-by: ericharper <[email protected]> * add multi-test Signed-off-by: ericharper <[email protected]> * add testing to jenkins tests Signed-off-by: ericharper <[email protected]> Signed-off-by: Карпов Николай Вячеславович <[email protected]>

…A#2113) * add multiple validation dataloaders Signed-off-by: ericharper <[email protected]> * loop over outputs in eval_epoch_end Signed-off-by: ericharper <[email protected]> * looping over val dataloaders in eval epoch end Signed-off-by: ericharper <[email protected]> * style Signed-off-by: ericharper <[email protected]> * add sync_dist Signed-off-by: ericharper <[email protected]> * rearrange name Signed-off-by: ericharper <[email protected]> * compute eval loss for each data loader Signed-off-by: ericharper <[email protected]> * set loss attr for each val dl Signed-off-by: ericharper <[email protected]> * set loss attr for each val dl Signed-off-by: ericharper <[email protected]> * default to dl index 0 Signed-off-by: ericharper <[email protected]> * default to dl index 0 Signed-off-by: ericharper <[email protected]> * clean up Signed-off-by: ericharper <[email protected]> * normalize one val dataset outputs Signed-off-by: ericharper <[email protected]> * add jenkins test for multi-val Signed-off-by: ericharper <[email protected]> * add multi-test Signed-off-by: ericharper <[email protected]> * add multi-test Signed-off-by: ericharper <[email protected]> * add multi-test Signed-off-by: ericharper <[email protected]> * add testing to jenkins tests Signed-off-by: ericharper <[email protected]> Signed-off-by: Micha Livne <[email protected]>

…A#2113) * add multiple validation dataloaders Signed-off-by: ericharper <[email protected]> * loop over outputs in eval_epoch_end Signed-off-by: ericharper <[email protected]> * looping over val dataloaders in eval epoch end Signed-off-by: ericharper <[email protected]> * style Signed-off-by: ericharper <[email protected]> * add sync_dist Signed-off-by: ericharper <[email protected]> * rearrange name Signed-off-by: ericharper <[email protected]> * compute eval loss for each data loader Signed-off-by: ericharper <[email protected]> * set loss attr for each val dl Signed-off-by: ericharper <[email protected]> * set loss attr for each val dl Signed-off-by: ericharper <[email protected]> * default to dl index 0 Signed-off-by: ericharper <[email protected]> * default to dl index 0 Signed-off-by: ericharper <[email protected]> * clean up Signed-off-by: ericharper <[email protected]> * normalize one val dataset outputs Signed-off-by: ericharper <[email protected]> * add jenkins test for multi-val Signed-off-by: ericharper <[email protected]> * add multi-test Signed-off-by: ericharper <[email protected]> * add multi-test Signed-off-by: ericharper <[email protected]> * add multi-test Signed-off-by: ericharper <[email protected]> * add testing to jenkins tests Signed-off-by: ericharper <[email protected]>

ericharper added 14 commits April 24, 2021 14:20

add multiple validation dataloaders

904786c

Signed-off-by: ericharper <[email protected]>

loop over outputs in eval_epoch_end

49399b3

Signed-off-by: ericharper <[email protected]>

looping over val dataloaders in eval epoch end

9eff3db

Signed-off-by: ericharper <[email protected]>

style

9807321

Signed-off-by: ericharper <[email protected]>

add sync_dist

b59e153

Signed-off-by: ericharper <[email protected]>

rearrange name

ec0485e

Signed-off-by: ericharper <[email protected]>

compute eval loss for each data loader

c5295c6

Signed-off-by: ericharper <[email protected]>

set loss attr for each val dl

15ee475

Signed-off-by: ericharper <[email protected]>

set loss attr for each val dl

4376b26

Signed-off-by: ericharper <[email protected]>

default to dl index 0

8fd2e2c

Signed-off-by: ericharper <[email protected]>

default to dl index 0

fc17b39

Signed-off-by: ericharper <[email protected]>

Merge branch 'main' into nmt_multi_val

38c73b5

clean up

b06d2e8

Signed-off-by: ericharper <[email protected]>

normalize one val dataset outputs

5d1dd3d

Signed-off-by: ericharper <[email protected]>

okuchaiev reviewed Apr 26, 2021

View reviewed changes

nemo/collections/nlp/data/machine_translation/machine_translation_dataset.py Show resolved Hide resolved

add jenkins test for multi-val

b8ef84f

Signed-off-by: ericharper <[email protected]>

okuchaiev approved these changes Apr 26, 2021

View reviewed changes

ericharper added 4 commits April 26, 2021 22:47

add multi-test

a47c361

Signed-off-by: ericharper <[email protected]>

add multi-test

2b883ba

Signed-off-by: ericharper <[email protected]>

add multi-test

6584159

Signed-off-by: ericharper <[email protected]>

add testing to jenkins tests

9d79d60

Signed-off-by: ericharper <[email protected]>

ericharper marked this pull request as ready for review April 27, 2021 05:01

ericharper merged commit dddf87e into main Apr 27, 2021

ericharper deleted the nmt_multi_val branch April 27, 2021 16:25

aklife97 mentioned this pull request May 6, 2021

Multilingual training for NMT #2160

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[NMT] Add support for multiple validation and test dataloaders #2113

[NMT] Add support for multiple validation and test dataloaders #2113

ericharper commented Apr 24, 2021 •

edited

Loading

okuchaiev left a comment

[NMT] Add support for multiple validation and test dataloaders #2113

[NMT] Add support for multiple validation and test dataloaders #2113

Conversation

ericharper commented Apr 24, 2021 • edited Loading

Usage

okuchaiev left a comment

Choose a reason for hiding this comment

ericharper commented Apr 24, 2021 •

edited

Loading