Извлечь несколько координат многоугольника из CSV-файла - PullRequest
0 голосов
/ 27 февраля 2019

Я хочу извлечь (несколько) координат многоугольника файла .xlsx в Panda Dataframe в Python.

.xlsx файл доступен на google docs .

Теперь я делаю это:

import pandas as pd  

gemeenten2019 = pd.read_excel('document.xlsx', index=False, skiprows=0 )
gemeenten2019['KML'] = str(gemeenten2019['KML'])

for index, row in gemeenten2019.iterrows():
    removepart = str(row['KML'])
    row['KML'] = removepart.replace('<MultiGeometry><Polygon><coordinates>', '')

gemeentenamen = []
gemeentePolygon = []

for gemeentenaam in gemeenten2019['NAAM']:
    gemeentenamen.append(str(gemeentenaam))

for value in gemeenten2019['KML']:
    gemeentePolygon.append(str(value))


df_gemeenteCoordinaten = pd.DataFrame({'Gemeente':gemeentenamen, 'KML': gemeentePolygon})
df_gemeenteCoordinaten

Но в результате каждый столбец («KML») имеет те же результаты.

result

Только мне нужны координаты для этой конкретной строки его столбца, а не все координаты всех столбцов.

Фрейм данных должен выглядеть следующим образом:

this

Кто-нибудь знает, как извлечь несколько координат для каждой строки?

1 Ответ

0 голосов
/ 27 февраля 2019

Это даст вам каждую пару значений в отдельной строке:

import pandas as pd  

gemeenten2019 = pd.read_excel('Gemeenten 2019.xlsx', index=False, skiprows=0)
gemeenten2019['KML'] = gemeenten2019['KML'].str.strip('<>/abcdefghijklmnopqrstuvwxyzGMP').str.replace(' ', '\n')

Например:

                    NAAM                                                KML
0            Aa en Hunze  6.81394482119469,53.070971596018\n6.8612875225...
1               Aalsmeer  4.79469736599488,52.2606817589009\n4.795085405...
2                 Aalten  6.63891586106867,51.9625470164657\n6.639463741...
3          Achtkarspelen  6.23217311778447,53.2567474241222\n6.235100748...
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...