Question

Я видел следующее поведение в Apache spark пару раз. Я не в состоянии понять, что представляет собой такое поведение, поэтому мы стремимся охватить широкое сообщество.

Рассмотрим следующий простой запрос

select emp_name,emp_id, emp_addr from employee where emp_dob in (select cal_dt from calendar where mon = 'oct' and year=1990)

Здесь мы просто пытаемся найти всех сотрудников с месяцем рождения. в октябре 1990 года значение «октябрь». В результате этого запроса на несколько тысяч разделов больше, чем показано ниже

select emp_name,emp_id, emp_addr from employee where emp_dob in ('1990-10-01','1990-10-02','1990-10-03'....'1990-10-31')

Может ли кто-нибудь помочь мне понять это поведение?

jjayadeep · Answer 1 · 11 ноября 2019

Это было обработано в https://issues.apache.org/jira/browse/SPARK-11150, который появится в Spark 3.0. Надеюсь, это поможет.

Spark внутренний запрос, приводящий к большому количеству разделов

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Spark внутренний запрос, приводящий к большому количеству разделов

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов