У меня есть два кадра данных в Spark, оба с колонкой IP. Один столбец содержит более 800000 записей, а другой - 4000 записей. Что я хочу сделать, это посмотреть, появляются ли IP-адреса в меньшем кадре данных в столбце IP большого кадра данных.
На данный момент все, что я могу сделать, это сравнить первую строку столбцов, вторые строки столбцов и т. Д. c.
Заранее спасибо!