Geopandas sjoin () ошибка: индекс списка вне диапазона - PullRequest
1 голос
/ 20 мая 2019

У меня есть два GeoDataFrames.У одной точки Shapely установлены как .geometry, у другой полигоны Shapely и мультиполигоны установлены как .geometry.Когда я пытаюсь использовать для них функцию sjoin(), я получаю сообщение об ошибке.

import pandas as pd
import geopandas as gpd

points_gdf = pd.read_pickle('points.pickle')
polys_gdf = pd.read_pickle('polys.pickle')

# points_gdf.geometry consists of shapely points
# polys_gdf.geometry consists of shapely polygons and multipolygons

# Now, I use the sjoin() function

return_gdf = gpd.sjoin(points_gdf, polys_gdf, how="inner", op='intersects')

Затем я получаю следующую ошибку:

---------------------------------------------------------------------------
IndexError                                Traceback (most recent call last)
<ipython-input-75-e5b042f3f0e2> in <module>
----> 1 return_gdf = gpd.sjoin(points_gdf, polys_gdf, how="inner", op='intersects')

~\AppData\Local\Continuum\anaconda3\lib\site-packages\geopandas\tools\sjoin.py in sjoin(left_df, right_df, how, op, lsuffix, rsuffix)
     73     tree_idx = rtree.index.Index(stream)
     74 
---> 75     idxmatch = (left_df.geometry.apply(lambda x: x.bounds)
     76                 .apply(lambda x: list(tree_idx.intersection(x))))
     77     idxmatch = idxmatch[idxmatch.apply(len) > 0]

~\AppData\Local\Continuum\anaconda3\lib\site-packages\pandas\core\series.py in apply(self, func, convert_dtype, args, **kwds)
   3192             else:
   3193                 values = self.astype(object).values
-> 3194                 mapped = lib.map_infer(values, f, convert=convert_dtype)
   3195 
   3196         if len(mapped) and isinstance(mapped[0], Series):

pandas/_libs/src\inference.pyx in pandas._libs.lib.map_infer()

~\AppData\Local\Continuum\anaconda3\lib\site-packages\geopandas\tools\sjoin.py in <lambda>(x)
     73     tree_idx = rtree.index.Index(stream)
     74 
---> 75     idxmatch = (left_df.geometry.apply(lambda x: x.bounds)
     76                 .apply(lambda x: list(tree_idx.intersection(x))))
     77     idxmatch = idxmatch[idxmatch.apply(len) > 0]

~\AppData\Local\Continuum\anaconda3\lib\site-packages\shapely\geometry\point.py in bounds(self)
    120     @property
    121     def bounds(self):
--> 122         xy = self.coords[0]
    123         return (xy[0], xy[1], xy[0], xy[1])
    124 

IndexError: list index out of range

Я пытался отделить polys_gdfв двух, один только с полигонами, а другой только с мультиполигонами.Но я получаю ту же ошибку.Кто-нибудь может мне помочь?

Рабочий код, воссоздающий ошибку:

import geopandas as gpd
from shapely.geometry import Point, Polygon

point_list = [Point(),Point(0.5,0.5)]
poly_list = [Polygon([[0, 0], [1, 0], [1, 1], [0, 1]])]

points_gdf = gpd.GeoDataFrame(geometry=point_list)
polys_gdf = gpd.GeoDataFrame(geometry=poly_list)

return_df = gpd.sjoin(points_gdf, polys_gdf, how="inner", op='within')

1 Ответ

0 голосов
/ 20 мая 2019

Так что сразу после публикации я обнаружил ошибку: у меня были несколько пустых фигурных точек в моем point_gdf. После удаления sjoin () работает как шарм.

import geopandas as gpd
from shapely.geometry import Point, Polygon

point_list = [Point(),Point(0.5,0.5)]
poly_list = [Polygon([[0, 0], [1, 0], [1, 1], [0, 1]])]

points_gdf = gpd.GeoDataFrame(geometry=point_list)
polys_gdf = gpd.GeoDataFrame(geometry=poly_list)

points_gdf = points_gdf[~points_gdf.geometry.is_empty] # delete empty points
return_df = gpd.sjoin(points_gdf, polys_gdf, how="inner", op='within')
...