config.json · wav2vec2-large-robust-24-ft-age-gender

config.json

2.3 KB · 123 lines · json Raw

1	`{`
2	`"_name_or_path": "/scratch/jwagner/git/age_experiments/230313_age-gender-multi-head-cel-24-paper/model/torch",`
3	`"activation_dropout": 0.1,`
4	`"adapter_kernel_size": 3,`
5	`"adapter_stride": 2,`
6	`"add_adapter": false,`
7	`"apply_spec_augment": true,`
8	`"architectures": [`
9	`"Model"`
10	`],`
11	`"attention_dropout": 0.1,`
12	`"bos_token_id": 1,`
13	`"classifier_proj_size": 256,`
14	`"codevector_dim": 768,`
15	`"contrastive_logits_temperature": 0.1,`
16	`"conv_bias": true,`
17	`"conv_dim": [`
18	`512,`
19	`512,`
20	`512,`
21	`512,`
22	`512,`
23	`512,`
24	`512`
25	`],`
26	`"conv_kernel": [`
27	`10,`
28	`3,`
29	`3,`
30	`3,`
31	`3,`
32	`2,`
33	`2`
34	`],`
35	`"conv_stride": [`
36	`5,`
37	`2,`
38	`2,`
39	`2,`
40	`2,`
41	`2,`
42	`2`
43	`],`
44	`"ctc_loss_reduction": "sum",`
45	`"ctc_zero_infinity": false,`
46	`"data": "agender,mozillacommonvoice,timit,voxceleb2",`
47	`"diversity_loss_weight": 0.1,`
48	`"do_stable_layer_norm": true,`
49	`"eos_token_id": 2,`
50	`"feat_extract_activation": "gelu",`
51	`"feat_extract_dropout": 0.0,`
52	`"feat_extract_norm": "layer",`
53	`"feat_proj_dropout": 0.1,`
54	`"feat_quantizer_dropout": 0.0,`
55	`"final_dropout": 0.1,`
56	`"finetuning_task": "age-gender",`
57	`"gradient_checkpointing": false,`
58	`"hidden_act": "gelu",`
59	`"hidden_dropout": 0.1,`
60	`"hidden_dropout_prob": 0.1,`
61	`"hidden_size": 1024,`
62	`"id2label": {`
63	`"0": "female",`
64	`"1": "male",`
65	`"2": "child"`
66	`},`
67	`"initializer_range": 0.02,`
68	`"intermediate_size": 4096,`
69	`"label2id": {`
70	`"child": 2,`
71	`"female": 0,`
72	`"male": 1`
73	`},`
74	`"layer_norm_eps": 1e-05,`
75	`"layerdrop": 0.1,`
76	`"mask_feature_length": 10,`
77	`"mask_feature_min_masks": 0,`
78	`"mask_feature_prob": 0.0,`
79	`"mask_time_length": 10,`
80	`"mask_time_min_masks": 2,`
81	`"mask_time_prob": 0.05,`
82	`"model_type": "wav2vec2",`
83	`"num_adapter_layers": 3,`
84	`"num_attention_heads": 16,`
85	`"num_codevector_groups": 2,`
86	`"num_codevectors_per_group": 320,`
87	`"num_conv_pos_embedding_groups": 16,`
88	`"num_conv_pos_embeddings": 128,`
89	`"num_feat_extract_layers": 7,`
90	`"num_hidden_layers": 24,`
91	`"num_negatives": 100,`
92	`"output_hidden_size": 1024,`
93	`"pad_token_id": 0,`
94	`"proj_codevector_dim": 768,`
95	`"sampling_rate": 16000,`
96	`"tdnn_dilation": [`
97	`1,`
98	`2,`
99	`3,`
100	`1,`
101	`1`
102	`],`
103	`"tdnn_dim": [`
104	`512,`
105	`512,`
106	`512,`
107	`512,`
108	`1500`
109	`],`
110	`"tdnn_kernel": [`
111	`5,`
112	`3,`
113	`3,`
114	`1,`
115	`1`
116	`],`
117	`"torch_dtype": "float32",`
118	`"transformers_version": "4.25.1",`
119	`"use_weighted_layer_sum": false,`
120	`"vocab_size": 32,`
121	`"xvector_output_dim": 512`
122	`}`
123