Я новичок в анализе настроений машинного обучения питонов и пытаюсь использовать некоторые коды из Интернета, чтобы понять это. Можно ли использовать отдельные обучающие и тестовые наборы данных для прогнозирования настроения? все, что я видел до сих пор - это использование sklearn train_test_split. Есть ли какие-нибудь примеры онлайн, которые я мог видеть?
У меня есть обучающий набор данных с 4000 помеченных вручную твитов, и я хотел бы использовать его для прогнозирования моего тестового набора данных твитов.
http://datasciencetoday.net/index.php/en-us/tutorials-top/163-sentiment-analysis-using-python-part-i-machine-learning-model-comparison
https://github.com/susanli2016/Machine-Learning-with-Python/blob/master/Consumer_complaints.ipynb
Я использовал эти сайты, чтобы помочь мне ... но он все еще просто разбивает учебные наборы данных.