SELECT county, state, deaths, cases, count (*) as count FROM table GROUP BY county, state, deaths, cases HAVING count(*)>1
Я получаю следующие данные из вышеуказанного запроса через SQL. То, что я хочу, это преобразовать этот SQL запрос в оба *
Пожалуйста, дайте мне знать, так как я новичок в Pandas и PySpark
Примечание - я не знаю я не хочу использовать spark.sql
вместо этого я хочу использовать spark.table
для чтения из таблицы и выполнения вышеупомянутых операций.