Я ищу СДР операцию, такую как like
в sql.Скажем, у меня есть столбец с разными IP-адресами, такими как:
192.168.1.1/
192.168.1.2/
192.168.1.3/
123.123.123.123/
1.1.1.1/
2.2.2.2/
Предположим, они относятся к другому типу RDD и DataFrame , поэтому мы можем выполнять некоторые операции напрямую.на них.Есть ли операция, которая имеет такой же результат в RDD , как следующий sql?
'SELECT count(host) from webIP where host like '192.168.1.%'.
Я знаю, как использовать функцию reduceByKey
для подсчета, такую как Lines.reduceByKey(lambda x, y: x+y)
, чтоЯ ищу похожую функцию, такую как like
в sql, чтобы узнать IP-адреса, начинающиеся с 192.168.1. * В RDD data.