Скажем, у меня есть столбец в кадре данных SparkSQL, например:
+-------+
| word |
+-------+
| chair |
| lamp |
| table |
+-------+
Я хочу разбить все префиксы следующим образом:
+--------+
| prefix |
+--------+
| c |
| ch |
| cha |
| chai |
| chair |
| l |
| la |
| lam |
| lamp |
| t |
| ta |
| tab |
| tabl |
| table |
+--------+
Есть ли хороший способ сделать это БЕЗ использования udfs или методов функционального программирования, таких как flatMap
в spark sql? (Я говорю о решении с использованием оптимальных функций codegen в org.apache.spark.sql.functions._
)