GPT2からLM作成 by abePclWaseda · Pull Request #2 · abePclWaseda/espnet

abePclWaseda · 2024-09-23T03:46:08Z

What?

Why?

RESULTS

Environments

date: Tue Oct 22 21:32:20 JST 2024
python version: 3.8.19 | packaged by conda-forge | (default, Mar 20 2024, 12:47:35) [GCC 12.3.0]
espnet version: espnet 202402
pytorch version: pytorch 1.13.1
Git hash: c3e3de659293976124a3c19eb94d9b207f485b16
- Commit date: Fri Oct 18 23:32:44 2024 +0900

exp/asr_train_asr_conformer_lr2e-3_warmup15k_amp_nondeterministic_raw_en_hugging_face_openai-community-gpt2_sp

WER

dataset	Snt	Wrd	Corr	Sub	Del	Ins	Err	S.Err
decode_asr_lm_lm_train_transformer_gpt2_en_hugging_face_valid.loss.ave_asr_model_valid.acc.ave/dev_clean	2703	54402	94.2	5.5	0.4	1.1	6.9	56.4
decode_asr_lm_lm_train_transformer_gpt2_en_hugging_face_valid.loss.ave_asr_model_valid.acc.ave/dev_other	2864	50948	84.3	14.2	1.5	2.2	17.9	81.4
decode_asr_lm_lm_train_transformer_gpt2_en_hugging_face_valid.loss.ave_asr_model_valid.acc.ave/test_clean	2620	52576	94.0	5.5	0.5	1.1	7.0	57.9
decode_asr_lm_lm_train_transformer_gpt2_en_hugging_face_valid.loss.ave_asr_model_valid.acc.ave/test_other	2939	52343	84.3	14.1	1.6	2.1	17.8	81.0

CER

dataset	Snt	Wrd	Corr	Sub	Del	Ins	Err	S.Err
decode_asr_lm_lm_train_transformer_gpt2_en_hugging_face_valid.loss.ave_asr_model_valid.acc.ave/dev_clean	2703	288456	98.1	1.2	0.7	0.9	2.8	56.4
decode_asr_lm_lm_train_transformer_gpt2_en_hugging_face_valid.loss.ave_asr_model_valid.acc.ave/dev_other	2864	265951	93.4	4.1	2.5	2.1	8.7	81.4
decode_asr_lm_lm_train_transformer_gpt2_en_hugging_face_valid.loss.ave_asr_model_valid.acc.ave/test_clean	2620	281530	98.1	1.1	0.8	0.9	2.7	57.9
decode_asr_lm_lm_train_transformer_gpt2_en_hugging_face_valid.loss.ave_asr_model_valid.acc.ave/test_other	2939	272758	93.4	4.0	2.6	1.9	8.5	81.0

TER

dataset	Snt	Wrd	Corr	Sub	Del	Ins	Err	S.Err

abePclWaseda · 2024-10-25T06:06:33Z

shallow fusionあり（成功っぽい）

RESULTS

Environments

date: Thu Oct 24 15:29:02 JST 2024
python version: 3.8.19 | packaged by conda-forge | (default, Mar 20 2024, 12:47:35) [GCC 12.3.0]
espnet version: espnet 202402
pytorch version: pytorch 1.13.1
Git hash: e54a7f26b452d7f621ba71b2e4b575c8a38e7737
- Commit date: Wed Oct 23 14:25:22 2024 +0900

exp/asr_train_asr_conformer_lr2e-3_warmup15k_amp_nondeterministic_raw_en_hugging_face_openai-community-gpt2_sp

WER

dataset	Snt	Wrd	Corr	Sub	Del	Ins	Err	S.Err
decode_asr_lm_lm_train_transformer_gpt2_en_hugging_face_valid.loss.ave_asr_model_valid.acc.ave/dev_clean	2703	54402	94.7	5.0	0.4	1.0	6.3	53.9
decode_asr_lm_lm_train_transformer_gpt2_en_hugging_face_valid.loss.ave_asr_model_valid.acc.ave/dev_other	2864	50948	85.6	13.0	1.4	2.1	16.5	78.5
decode_asr_lm_lm_train_transformer_gpt2_en_hugging_face_valid.loss.ave_asr_model_valid.acc.ave/test_clean	2620	52576	94.6	5.0	0.4	1.0	6.4	55.0
decode_asr_lm_lm_train_transformer_gpt2_en_hugging_face_valid.loss.ave_asr_model_valid.acc.ave/test_other	2939	52343	85.4	13.1	1.5	2.0	16.6	78.7
decode_asr_lm_lm_train_transformer_gpt2_en_hugging_face_valid.loss.ave_asr_model_valid.acc_1022.ave/dev_clean	2703	54402	94.2	5.5	0.4	1.1	6.9	56.4
decode_asr_lm_lm_train_transformer_gpt2_en_hugging_face_valid.loss.ave_asr_model_valid.acc_1022.ave/dev_other	2864	50948	84.3	14.2	1.5	2.2	17.9	81.4
decode_asr_lm_lm_train_transformer_gpt2_en_hugging_face_valid.loss.ave_asr_model_valid.acc_1022.ave/test_clean	2620	52576	94.0	5.5	0.5	1.1	7.0	57.9
decode_asr_lm_lm_train_transformer_gpt2_en_hugging_face_valid.loss.ave_asr_model_valid.acc_1022.ave/test_other	2939	52343	84.3	14.1	1.6	2.1	17.8	81.0

CER

dataset	Snt	Wrd	Corr	Sub	Del	Ins	Err	S.Err
decode_asr_lm_lm_train_transformer_gpt2_en_hugging_face_valid.loss.ave_asr_model_valid.acc.ave/dev_clean	2703	288456	98.2	1.1	0.7	0.8	2.6	53.9
decode_asr_lm_lm_train_transformer_gpt2_en_hugging_face_valid.loss.ave_asr_model_valid.acc.ave/dev_other	2864	265951	93.8	3.8	2.3	1.9	8.1	78.5
decode_asr_lm_lm_train_transformer_gpt2_en_hugging_face_valid.loss.ave_asr_model_valid.acc.ave/test_clean	2620	281530	98.3	1.0	0.7	0.8	2.5	55.0
decode_asr_lm_lm_train_transformer_gpt2_en_hugging_face_valid.loss.ave_asr_model_valid.acc.ave/test_other	2939	272758	93.8	3.7	2.5	1.8	8.0	78.7
decode_asr_lm_lm_train_transformer_gpt2_en_hugging_face_valid.loss.ave_asr_model_valid.acc_1022.ave/dev_clean	2703	288456	98.1	1.2	0.7	0.9	2.8	56.4
decode_asr_lm_lm_train_transformer_gpt2_en_hugging_face_valid.loss.ave_asr_model_valid.acc_1022.ave/dev_other	2864	265951	93.4	4.1	2.5	2.1	8.7	81.4
decode_asr_lm_lm_train_transformer_gpt2_en_hugging_face_valid.loss.ave_asr_model_valid.acc_1022.ave/test_clean	2620	281530	98.1	1.1	0.8	0.9	2.7	57.9
decode_asr_lm_lm_train_transformer_gpt2_en_hugging_face_valid.loss.ave_asr_model_valid.acc_1022.ave/test_other	2939	272758	93.4	4.0	2.6	1.9	8.5	81.0

TER

dataset	Snt	Wrd	Corr	Sub	Del	Ins	Err	S.Err

abePclWaseda added 10 commits September 23, 2024 12:45

initial commit

a976e72

初期準備(途中)

4aaa664

初期準備(途中)

d6d175c

_filtered_4000追加

877e370

facebook/opt-125m -> openai-community/gpt2

8aba629

4000以下にソートするコード追加

469d183

configのファイル名修正

7ff4d30

Huggingfaceのものを使うように修正

57e3ccb

学習データの大きさ調節

7204e8a

The length of the text output exceeds 500の警告をコメントアウト

0c7d1d1

abePclWaseda self-assigned this Sep 26, 2024

abePclWaseda added 13 commits September 26, 2024 18:49

OPTの部分をGPT2に変えただけ

e9b5c2c

GPTのパラメータに変更(wte.weight)

1ebb250

不要なコメントアウト削除

28680fc

書き方を元コードに合わせる

5254417

元コードに似せる

4f06e9d

コード整理

f2873ff

コメントの位置移動

538a176

フォーマット変更

6cc96e3

isGPT2の場合分け導入

9720964

フォーマット整形

6db9358

opt -> gpt2にあたって、resume をfalseに変更

33aebc3

1024トークン以下になることを目指して、文字数を1000で切るように修正

86e97d7

convert_to_lowercase_text.py追加

7937f37

CtrlCで中断したことの対応策

c3e3de6

gpt2のshallow fusionお試し中

e54a7f2

Speech2Text の引数見る

8489b20

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

GPT2からLM作成#2

GPT2からLM作成#2
abePclWaseda wants to merge 26 commits intomainfrom
feature/makeLMFromGPT2

abePclWaseda commented Sep 23, 2024

Uh oh!

abePclWaseda commented Oct 7, 2024

Uh oh!

abePclWaseda commented Oct 23, 2024

Uh oh!

abePclWaseda commented Oct 25, 2024 •

edited

Loading

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Conversation

abePclWaseda commented Sep 23, 2024

What?

Why?

See also

Uh oh!

abePclWaseda commented Oct 7, 2024

Uh oh!

abePclWaseda commented Oct 23, 2024

RESULTS

Environments

exp/asr_train_asr_conformer_lr2e-3_warmup15k_amp_nondeterministic_raw_en_hugging_face_openai-community-gpt2_sp

WER

CER

TER

Uh oh!

abePclWaseda commented Oct 25, 2024 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

RESULTS

Environments

exp/asr_train_asr_conformer_lr2e-3_warmup15k_amp_nondeterministic_raw_en_hugging_face_openai-community-gpt2_sp

WER

CER

TER

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

abePclWaseda commented Oct 25, 2024 •

edited

Loading