Разделение Dataframe с уникальными и дубликатами - PullRequest
0 голосов
/ 14 января 2020

Входной кадр данных:

df=
+---+---+---+---+---+
|  1|  2|  3|  4|  5|
+---+---+---+---+---+
|  a|  b|  c|  d|  E|
|  a|  b|  c|  d|  F|
|  a|  b|  d|  d|  H|
|  a|  c|  c|  d|  E|
|  a|  a|  c|  d|  E|
|  a|  b|  c|  d|  L|
|  a|  c|  c|  d|  E|
+---+---+---+---+---+`

код

String[] col={"1", "2","3"};
Dataframe a=df.dropDuplicates(col);
Dataframe b=df.except(a);
a.show();
+---+---+---+---+---+
|  1|  2|  3|  4|  5|
+---+---+---+---+---+
|  a|  a|  c|  d|  E|
|  a|  b|  c|  d|  E|
|  a|  b|  d|  d|  H|
|  a|  c|  c|  d|  E|
+---+---+---+---+---+`

b.show();
+---+---+---+---+---+
|  1|  2|  3|  4|  5|
+---+---+---+---+---+
|  a|  b|  c|  d|  L|
|  a|  b|  c|  d|  F|
+---+---+---+---+---+`

Но мне нужен выход для b, равный

b.show();
+---+---+---+---+---+
|  1|  2|  3|  4|  5|
+---+---+---+---+---+
|  a|  b|  c|  d|  L|
|  a|  b|  c|  d|  F|
|  a|  c|  c|  d|  E|
+---+---+---+---+---+
...