Я пытаюсь создать 3 модели классификации: наивный байесовский, случайный лес и SVM.
Переменная, которую я пытаюсь предсказать, это Film Verdict с категориями «хит» или «флоп».Я разработал значения этой переменной с помощью формулы Доход / Бюджет, где, если значение этой формулы было 1+, оно классифицировалось как попадание или провал.
У меня такой вопрос: поскольку я использовал Доход и бюджет для создания переменной «Приговор фильма», могу ли я использовать эти два в качестве части объясняющих / независимых переменных в моих моделях?
Пояснение: Iесть несколько других переменных, таких как ActorRating, Tweet Polarity и т. д., которые также используются в качестве входных переменных.