Я реализую алгоритм для получения правил ассоциации в среде больших данных. На данный момент мой алгоритм работает только с чисто числовыми базами данных, но не работает с именными базами данных. Мне нужен способ преобразования данных в номинальных столбцах в числовые значения, чтобы каждое номинальное значение было связано с дискретным числовым значением. Пока мне удалось получить только разные значения в каждом столбце.
db.schema.foreach { column =>
val valuesDistinct = db.select(column.name).distinct
val values = valuesDistinct.map(row => row(0).toString).collect
}