Сегодня я работаю над набором данных из Kaggle https://www.kaggle.com/c/house-prices-advanced-regression-techniques/data. Я хотел бы попытаться использовать DBSCAN, который объединяет кровать, ванную, соседство и цену. Проблема в том, что я не знаю, как справиться с окрестностью строковой переменной, я пытался использовать переменную-пустышку, а это не относится к многим окрестностям. У кого-нибудь есть идея? Большое спасибо заранее, не стесняйтесь комментировать, чтобы получить больше информации.