Я пытаюсь работать с некоторым анализом настроений, но, к сожалению, застрял в самом начале, я даже не могу импортировать файл.
Данные находятся здесь: http://snap.stanford.edu/data/web-FineFoods.html
Это 353 МБ .txt файл, который выглядит следующим образом:
product/productId: B001E4KFG0
review/userId: A3SGXH7AUHU8GW
review/profileName: delmartian
review/helpfulness: 1/1
review/score: 5.0
review/time: 1303862400
review/summary: Good Quality Dog Food
review/text: I have bought several of the Vitality canned dog food products and have
found them all to be of good quality. The product looks more like a stew than a
processed meat and it smells better. My Labrador is finicky and she appreciates this
product better than most.
Все мои попытки выбросили эти данные в один столбец, и я не уверен, как мне правильно сортировать их, чтобы обработать их в текстовом формате.
Я был бы рад колонкам с заголовками, показанными в каждой строке здесь.
Цените любое направление.