config.json · nli-MiniLM2-L6-H768

config.json

875 B · 37 lines · json Raw

1	`{`
2	`"_name_or_path": "nreimers/MiniLMv2-L6-H768-distilled-from-RoBERTa-Large",`
3	`"architectures": [`
4	`"RobertaForSequenceClassification"`
5	`],`
6	`"attention_probs_dropout_prob": 0.1,`
7	`"bos_token_id": 0,`
8	`"eos_token_id": 2,`
9	`"gradient_checkpointing": false,`
10	`"hidden_act": "gelu",`
11	`"hidden_dropout_prob": 0.1,`
12	`"hidden_size": 768,`
13	`"id2label": {`
14	`"0": "contradiction",`
15	`"1": "entailment",`
16	`"2": "neutral"`
17	`},`
18	`"initializer_range": 0.02,`
19	`"intermediate_size": 3072,`
20	`"label2id": {`
21	`"contradiction": 0,`
22	`"entailment": 1,`
23	`"neutral": 2`
24	`},`
25	`"layer_norm_eps": 1e-05,`
26	`"max_position_embeddings": 514,`
27	`"model_type": "roberta",`
28	`"num_attention_heads": 12,`
29	`"num_hidden_layers": 6,`
30	`"pad_token_id": 1,`
31	`"position_embedding_type": "absolute",`
32	`"transformers_version": "4.6.1",`
33	`"type_vocab_size": 1,`
34	`"use_cache": true,`
35	`"vocab_size": 50265`
36	`}`
37