У меня есть pyspark dataframe с большим количеством столбцов, и я хочу выбрать те, которые содержат определенную строку, и другие.Например:
df.columns = ['hello_world','hello_country','hello_everyone','byebye','ciao','index']
Я хочу выбрать те, которые содержат 'hello' , а также столбец с именем 'index' , поэтому результат будет:
['hello_world','hello_country','hello_everyone','index']
Я хочу что-то вроде df.select('hello*','index')
Заранее спасибо:)
РЕДАКТИРОВАТЬ:
Я нашелбыстрый способ решить ее, поэтому я ответил себе, стиль Q & A .Если кто-то увидит мое решение и сможет предложить лучшее, я буду признателен за это