Вы можете сделать это с помощью выбора
val df : DataFrame=[(id1,text),(id2,text2),...] //df where each row has two columns "id","text"
val dfResult: DataFrame = df.select("id")
Если вы не знаете имя столбца и не знаете позицию, вы также можете сделать:
df.select(aux.columns(0))