У меня есть два кадра данных. Первый содержит список точек широты и долготы, а также идентификационный номер, связанный с человеком, который находился в этих координатах, и дату, когда они были там. Второй имеет названия определенных магазинов (всего около 1000) и координаты, которые очерчивают многоугольник, связанный с каждым магазином. Я хочу как-то объединить эти два в scala (кирпичи данных), чтобы подсчитать количество посещений каждого места за определенный промежуток времени.
Я попытался просто соединить два фрейма данных, но, поскольку данные полигона имеют несколько точек, содержащих информацию только о контуре многоугольника, это не работает. Мне нужно количество точек (широта и долгота), которые ВНУТРИ каждого полигона.
+-------------+----------------+
|ID| latitude |longitude| date |
+-------------+----------------+
|1 | xx | yy |1/1/18|
|2 | xx | yy |1/2/18|
|3 | xx | yy |1/1/18|
|3 | xx | yy |1/3/18|
|3 | xx | yy |1/1/18|
|4 | xx | yy |1/5/18|
|5 | xx | yy |1/5/18|
|5 | xx | yy |1/5/18|
+-------------+----------------+
+-------------+-----------------------+
|location_name|polygon |
+-------------+-----------------------+
|Location1 |POLYGON((x y, x y,...))|
|Location2 |POLYGON((x y, x y,...))|
|Location3 |POLYGON((x y, x y,...))|
|Location4 |POLYGON((x y, x y,...))|
|Location5 |POLYGON((x y, x y,...))|
|Location6 |POLYGON((x y, x y,...))|
|Location7 |POLYGON((x y, x y,...))|
|Location8 |POLYGON((x y, x y,...))|
+-------------+------------------------+
Я просто хочу получить количество посещений каждого местоположения - количество точек с первого кадра данных в каждом многоугольнике со второго кадра данных.