Я использую Kaggles https://www.kaggle.com/c/two-sigma-connect-rental-listing-inquiries/data
Файл json train для анализа характеристик и данных и применения других алгоритмов, чтобы проверить, могу ли я повысить точность.
Например, у меня есть столбец: характеристики:
Пример:
l <- structure(list(`4` = c("Dining Room", "Pre-War", "Laundry in Building",
"Dishwasher", "Hardwood Floors", "Dogs Allowed", "Cats Allowed"
), `6` = c("Doorman", "Elevator", "Laundry in Building", "Dishwasher",
"Hardwood Floors", "No Fee"), `9` = c("Doorman", "Elevator",
"Laundry in Building", "Laundry in Unit", "Dishwasher", "Hardwood Floors"
), `10` = list(), `15` = c("Doorman", "Elevator", "Fitness Center",
"Laundry in Building")), .Names = c("4", "6", "9", "10", "15"
))
Я хочу создать фрейм данных, который выглядит следующим образом:
name nested list
4 <list = list(c("Dining Room", "Pre-War", "Laundry in Building",
"Dishwasher", "Hardwood Floors", "Dogs Allowed", "Cats Allowed"))>
6 <list = list(c("Doorman", "Elevator", "Laundry in Building", "Dishwasher", "Hardwood Floors", "No Fee"))>
9 <list = list(c("Doorman", "Elevator",
"Laundry in Building", "Laundry in Unit", "Dishwasher", "Hardwood Floors"))>
10 <list = list(c())>
15 <list = list(c("Doorman", "Elevator", "Fitness Center",
"Laundry in Building")))>
Посоветуйте, пожалуйста, как это сделать.
Я немного запутался, как его преобразовать.
Моя конечная цель - создать информационный кадр со всеми этими объединенными функциями, и каждые 4, 6, 10, 15 ... будут иметь свои собственные 1 и 0, если у них есть эти функции, одна горячая кодировка из них.
Пожалуйста, сообщите.