Попытка прочитать файл .txt
в моей записной книжке Jupyter.
Это мой код:
acm = pd.read_csv('outputacm.txt', header=None, error_bad_lines=False)
Вот пример моего текстового файла:
#*OQL[C++]: Extending C++ with an Object Query Capability.
#@José A. Blakeley
#confModern Database Systems
#*Transaction Management in Multidatabase Systems.
#@Yuri Breitbart,Hector Garcia-Molina,Abraham Silberschatz
#confModern Database Systems
#*Overview of the ADDS System.
#@Yuri Breitbart,Tom C. Reyes
#confModern Database Systems
И различные символы должны соответствовать:
#* --- paperTitle
#@ --- Authors
#year ---- Year
#conf --- publication venue
#citation --- citation number (both -1 and 0 means none)
#index ---- index id of this paper
#arnetid ---- pid in arnetminer database
#% ---- the id of references of this paper (there are multiple lines, with each indicating a reference)
#! --- Abstract
Не уверен, как настроить это так, чтобы данные читались правильно. В идеале, я хотел бы, чтобы фрейм данных, где каждая категория представляет собой отдельный столбец, а затем все записи в документе являются строками. Спасибо!