Я довольно новичок в улье и искре, но то, что я хочу сделать, кажется, что это должно быть просто. По сути, я хочу взять список из Python, а затем только извлекать записи из улья, которые имеют ключ в этом списке. Как это:
my_list=['a','b','c','d']
new_dataset =
spark.sql(
select *
from hive_dataset
where variable_name in my_list)
Я бы даже справился с этим после оператора sql. Как это:
my_list=['a','b','c','d']
new_dataset =
spark.sql(
select *
from hive_dataset)
new_dataset=new_dataset(new_dataset[variable_name] in my_list)
Я знаю, что это довольно общий вопрос, но как мне это сделать? Это вообще возможно?