Ищете альтернативное решение ARRAY_CONTAINS для Spark SQL - PullRequest
0 голосов
/ 23 сентября 2018

Я использую вложенную структуру данных (массив) для хранения многозначных атрибутов для таблицы Spark.Я использую array_contains (массив, значение) в Spark SQL, чтобы проверить, содержит ли массив значение, но кажется, что есть проблема с производительностью.Для большого стола Spark требуется много времени.Есть ли альтернативное решение этой проблемы?

1 Ответ

0 голосов
/ 23 сентября 2018

вы не предоставили много подробностей о том, что именно вы делаете - если вы часто обращаетесь к значениям внутри массива, если может быть полезно добавить столбцы со значениями из массива, например, используя взорваться

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...