Я хочу организовать обзоры продуктов для анализа текста.Как лучше организовать данные?
Я хочу показать учащимся, как выполнять анализ текста с помощью sklearn, но я хочу, чтобы они использовали свои собственные данные.Пример, который я хочу использовать, чтобы начать их, состоит из обзоров продуктов.Они находятся в текстовом формате в файле CSV.Каждая запись является рецензией и, следовательно, документом.Весь файл - это корпус.Это лучший способ организовать обзоры?Или каждый отзыв должен быть отдельным текстовым файлом?В любом случае, панды лучше всего импортировать текст или следует использовать функции чтения Python?Любые предложения по организации данных приветствуется.