Python Исключение «Невозможно засолить локальный объект» во время обучения BertModel - PullRequest
0 голосов
/ 28 мая 2020

Я использую simpletransformers.classification, чтобы обучить модера Берта классифицировать некоторые текстовые поля. Вот мой код.

from simpletransformers.classification import ClassificationModel

import torch

import numpy as np # linear algebra

import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)

from simpletransformers.classification import ClassificationModel

from pytorch_pretrained_bert import BertTokenizer, BertModel, BertForMaskedLM, BertForSequenceClassification

import parallelTestModule

# Lets import the csv file in pandas dataframe first
train_df = pd.read_csv('D:\\7allV03Small.csv', encoding='utf-8', header=None, names=['cat', 'text'])

# Check the df

# unique categories
print("Total categories",len(

# convert string labels to integers
train_df['labels'] = pd.factorize([0]


# Let's create a train and test set
from sklearn.model_selection import train_test_split

train, test = train_test_split(train_df, test_size=0.2, random_state=42)

print('Eğitim veri seti boyutu : ' + str(train.shape), ' Test eğitim seti : ' + str(test.shape))

if __name__ == "__main__":
    from multiprocessing import freeze_support

    model = ClassificationModel('bert', 'bert-base-multilingual-uncased',  use_cuda=False,  num_labels=8, args={'reprocess_input_data': True, 'overwrite_output_dir': True, 'num_train_epochs': 1,'train_batch_size':1})


    # Now lets fine tune bert with the train set

Все в порядке, и начинается тренировка. Но в конце обучения выдает ошибку, как показано ниже.

Traceback (most recent call last):
  File "c:/Users/arslanom/Desktop/text/", line 45, in <module>
  File "C:\Users\arslanom\AppData\Roaming\Python\Python36\site-packages\simpletransformers\classification\", line 269, in train_model
  File "C:\Users\arslanom\AppData\Roaming\Python\Python36\site-packages\simpletransformers\classification\", line 544, in train
    self._save_model(output_dir_current, optimizer, scheduler, model=model)
  File "C:\Users\arslanom\AppData\Roaming\Python\Python36\site-packages\simpletransformers\classification\", line 1113, in _save_model, os.path.join(output_dir, ""))
  File "C:\Users\arslanom\AppData\Roaming\Python\Python36\site-packages\torch\", line 209, in save
    return _with_file_like(f, "wb", lambda f: _save(obj, f, pickle_module, pickle_protocol))
  File "C:\Users\arslanom\AppData\Roaming\Python\Python36\site-packages\torch\", line 134, in _with_file_like
    return body(f)
  File "C:\Users\arslanom\AppData\Roaming\Python\Python36\site-packages\torch\", line 209, in <lambda>
    return _with_file_like(f, "wb", lambda f: _save(obj, f, pickle_module, pickle_protocol))
  File "C:\Users\arslanom\AppData\Roaming\Python\Python36\site-packages\torch\", line 282, in _save
AttributeError: Can't pickle local object 'get_linear_schedule_with_warmup.<locals>.lr_lambda'

Похоже, эта проблема связана с worker_count, потому что он работает с использованием многопоточности. Но я не нашел решения.

Операционная система: Windows 10 Оперативная память: 16 Гб
