Spark DataFrame выбрать столбец из строки - PullRequest
0 голосов
/ 09 апреля 2019

Привет, я хочу создать df с одним столбцом из df с несколькими столбцами.Посмотрите этот псевдокод:

df=[(id1,text),(id2,text2),...] //df where each row has two columns "id","text"
id_column=df.map(row=>row._1)

Как я могу сделать это в свече ??

Ответы [ 2 ]

0 голосов
/ 09 апреля 2019

Нашел это !! То, что я хотел, было:

having a df like:
| id | text  |
| 1  |  bla1 |     
| 2  | foo   |
//real scala/spark code...
just_ids=df.map(row=>row.getAs[Int](0))
0 голосов
/ 09 апреля 2019

Вы можете сделать это с помощью выбора

val df : DataFrame=[(id1,text),(id2,text2),...] //df where each row has two columns "id","text"

val dfResult: DataFrame = df.select("id")

Если вы не знаете имя столбца и не знаете позицию, вы также можете сделать:

df.select(aux.columns(0))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...