Я пытаюсь использовать предварительно обученную модель SciBERT, а именно: scibert-scivocab-uncased следующим образом:
!pip install pytorch-pretrained-bert
import torch
from pytorch_pretrained_bert import BertTokenizer, BertModel, BertForMaskedLM
import logging
import matplotlib.pyplot as plt
tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
indexed_tokens = tokenizer.convert_tokens_to_ids(tokenized_text)
segments_ids = [1] * len(tokenized_text)
tokens_tensor = torch.tensor([indexed_tokens])
segments_tensors = torch.tensor([segments_ids])
model = BertModel.from_pretrained('/Users/.../Downloads/scibert_scivocab_uncased-3.tar.gz')
И получаю следующую ошибку:
EOFError: Compressed file ended before the end-of-stream marker was reached
Я скачал файл с веб-сайта (https://github.com/allenai/scibert)
Я конвертировал его из "tar" в gzip
Ничего не получалось.
Любой намек на то, как к этому подойти?
Спасибо!