У меня есть два фрейма данных:
Первый со значениями AVG:
+----------+-----+
| Category | AVG |
+----------+-----+
| Categ | 1.0 |
+----------+-----+
| Categ2 | 0.5 |
+----------+-----+
...
...
Второй имеет следующую категорию: Категория, Имя, Цена
Вопрос: Как могу ли я удалить все те записи, цена которых меньше средней цены из первой таблицы ??
Я пробовал таким способом:
dataGreaterAvge = data.where(data.Price >= avgCategoryPrice.where(data.Category == avgCategoryPrice.Category).collect()[0]["avg(Price)"])
dataGreaterAvge - First dataframe
data - Second dataframe
Однако это не работает должным образом, потому что он берет только значение первого элемента из таблицы средних значений