Прежде всего, извините, если это неправильное место, чтобы спросить, пожалуйста, удалите или переместите, если это так.
Я собрал информацию о постах reddit, которые попали на главную страницу, эти данные включают в себя:
Заглавные слова, Заглавные буквы, Час публикации, Возраст автора, Карма ссылки автора, Карма комментария автора, Возраст Subreddit, Подписчики Subreddit
![data set](https://i.stack.imgur.com/SiD9v.png)
I имеет 500 записей, но при необходимости может собирать проще, нужно ли нормализовать эти данные?
Я пытаюсь обучить сеть, в которой я могу ввести эти значения для новых сообщений, и это дает мне оценку от 0 до 1 из них попал на главную страницу.
Я читал, что регрессия logisti c с нормализацией данных может работать, кто-нибудь может предложить лучший метод, который я могу использовать в python ?
Спасибо