Импортировать текстовый файл UTF-8 (и вводить во фрейм данных) - PullRequest
0 голосов
/ 24 февраля 2020

Вот пример выходных данных для входного текстового файла.

PT AU BA CA GP RI J Garcia-Perez, Guillermo; Росси, Маттео А. C .; Манискалько, Сабрина Росси, Маттео / Е-4964-2015 Росси, Маттео / 0000-0003-4665-9284; Garcia-Perez, Guillermo / 0000-0002-9006-060X IBM Q Опыт работы в качестве универсального экспериментального испытательного стенда для моделирования открытых квантовых систем NPJ КВАНТОВАЯ ИНФОРМАЦИЯ 6 1 1 10.1038 / s41534-019-0235-y DE C 2020

В настоящее время я использую следующий код:

df = pd.read_fwf('savedrecs-2.txt')
df.head()

Однако результаты не разделяются в соответствии со столбцами в текстовом файле utf-8.

Текущий вывод:

0
0   PT\tAU\tBA\tCA\tGP\tRI\tOI\tBE\tZ2\tTI\tX1\tY...
1   J\tGarcia-Perez, Guillermo; Rossi, Matteo A. C...
2   J\tScholes, Colin A.; Kentish, Sandra E.; Qade...
3   J\tVillain-Gambier, M.; Courbalay, M.; Klem, A...
4   J\tShahmahdi, Najmeh; Dehghanzadeh, Reza; Asla...

Ожидаемый результат (пример)

PT            AU    BA  CA  GP  RI
Garcia-Perez  xy    xy  xy  xy  xy
Guillermo     xy    xy  xy  xy  xy

1 Ответ

1 голос
/ 24 февраля 2020

Появляется следующий код для возврата ожидаемого результата.

filename = 'savedrecs-8.txt'

doc = codecs.open(filename,'rU','UTF-8')
df = pd.read_csv(doc, sep='\t')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...