Во-первых, у нас есть категория таблицы улья в улье:
id | name
1 | history
2 | art
...
Затем мы читаем коллекцию книг из mongodb для искровых фреймов данных:
bookname | category
Europe | history book
Drawing | arts
здесь, если book.category содержит category.name, тогда мне нужно преобразовать его в id.например, ожидаемый вывод - это фрейм данных, подобный следующему:
bookname | category
Europe | 1
Drawing | 2
Внимание! Я знаю, что могу использовать rdd.map (), но проблема в том, что количество полей больше 22 на самом деле,но tuple23 не разрешен, поэтому я не могу использовать rdd.map следующим образом:
bookDf.rdd.map(f=>{
....
(field1,field2,.....filed50)//illegle
}).toDF()
любым другим способом?