Как реализовать SciBERT с помощью pytorch;ошибка при загрузке - PullRequest
0 голосов
/ 12 октября 2019

Я пытаюсь использовать предварительно обученную модель SciBERT, а именно: scibert-scivocab-uncased следующим образом:

    !pip install pytorch-pretrained-bert 
    import torch
    from pytorch_pretrained_bert import BertTokenizer, BertModel,      BertForMaskedLM 
    import logging
    import matplotlib.pyplot as plt
    tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
    indexed_tokens = tokenizer.convert_tokens_to_ids(tokenized_text) 
    segments_ids = [1] * len(tokenized_text)
    tokens_tensor = torch.tensor([indexed_tokens])
    segments_tensors = torch.tensor([segments_ids])
    model =      BertModel.from_pretrained('/Users/.../Downloads/scibert_scivocab_uncased-3.tar.gz') 

И получаю следующую ошибку:

EOFError: Compressed file ended before the end-of-stream marker was reached
  1. Я скачал файл с веб-сайта (https://github.com/allenai/scibert)

  2. Я конвертировал его из "tar" в gzip

Ничего не получалось.

Любой намек на то, как к этому подойти?

Спасибо!

...