То, что я уже знаю, это то, что Наивный Байес лучше использовать для функций (в терминах ОД), которые имеют условную независимость. Условная независимость от того, что я понимаю, - это когда информация, полученная из одной функции, не влияет на вероятность другой функции.
В моем случае я хочу провести анализ настроений для твитов мнений об услугах авиакомпании. Так что единственная особенность, которую я имел, - это сам твит. И есть ярлык, который отметил твит, если твит отрицательный, положительный или нейтральный.
Итак, это означает, что моя функция только одна. И я не знаю, можно ли считать это условной независимостью. Может кто-нибудь объяснить это мне?
Образец моего набора данных: