Awesome
XLMRoberta Brazilian Portuguese :brazil:
<!--:uk: English [documentation here](README_en.md)-->Sobre este repositório
Aqui você encontra o código-fonte usado para o fine-tunning do modelo XML-Roberta-base, além de um script para transformar o BrWac.vert em um formato adequado para o treino de nosso modelo de linguagem.
Download do modelo: XLMRoberta-Pt-Br
Execução
Para executar o script use:
nohup python3 -m tgfmlm -mode mlm \
--output_dir /thegoodfellas/model \
--base_model xlm-roberta-base \
--dataset_id thegoodfellas/brwac_sentences \
--wandb_project tgf-xlm-roberta-base-pt-br \
--wandb_run_id tgf-xlm-roberta-base-pt-br-v1.3 \
--wandb_entity thegoodfellas \
--epochs 2 \
--batch_size 16 \
--gradient_accumulation_steps 8 \
--lr 1e-4 \
--logging_steps 10 \
--save_steps 200 \
--max_length 512 \
--warmup_steps 1_000 \
--num_proc 50 \
--hub_model_id thegoodfellas/tgf-xlm-roberta-base-pt-br &
Acompanhe os logs pelo WandB