Подготовить план данных для обучения модели Flair - PullRequest
0 голосов
/ 12 января 2020

Я пытаюсь получить фрейм данных в формате ниже в текстовый файл, как показано на скриншоте.

Я довольно близко подошел к показанному коду, но при попытке прочитать текстовый файл я получаю следующую ошибку в мой алгоритм ML: "tags = set ([label.value для отправленного в self.train для ярлыка в sent.labels]) AttributeError: у объекта 'NoneType' нет атрибута 'tags'"

Может кто-нибудь помочь ?

output['label']=['__label__'+ s for s in output['label'].astype(str)]
output['text']= output['text'].replace('\n',' ', regex=True).replace('\t',' ', regex=True)
output.to_csv(r'sst_train.csv', index=False, sep=' ', header=False)

Input

Output

1 Ответ

0 голосов
/ 12 января 2020

Ниже работает:

lab = data['label'].tolist()
text = data['text'].tolist()
with open('test.txt', 'w') as outfile:
    for x in range(len(lab)):
        l1 = str(lab[x])
        print(type(l1))
        t1 = str(text[x])
        print(t1)
        d = 'ewdwed'
        message = "__label__{}\t{}\n".format(l1,t1)
        outfile.write(message)
...