Панды не читают в файле правильно - PullRequest
0 голосов
/ 09 июня 2018

У меня есть файл данных, приведенный здесь: * https://www.dropbox.com/sh/8lsvigjjpjhdlap/AAD3VpFdBifGMxrq5C-6yhpPa?dl=0

и следующий код: *

import pandas as pd       
df = pd.read_table('Best_2018_Table1.txt', sep=r"\s*")

, но что-то не работает, и панды не читают это, якобы, плохо отформатированныйтаблица ::

df.columns
df['PS1gmag']

Как лучше всего читать в этом типе файлов для столбцов ??

Ответы [ 2 ]

0 голосов
/ 17 июня 2018

Ваш файл имеет поля фиксированной ширины (за исключением заголовков) и должен читаться как таковой.

Использование пробела в качестве разделителя не будет работать, поскольку некоторые поля пусты и поместят данные в неправильный столбец., например:

2MASS_J00492677-0635467     M8.5         8.5 null                   M8.5
WISEPC_J004928.48+044100.1  null             L9                19.  L9
WISE_J004945.61+215120.0    null             T8.5              28.5 T8.5
SIPS_J0050-1538             L1:         11.  L0.5              10.5 L1:

станет:

2MASS_J00492677-0635467     M8.5        8.5   null  M8.5
WISEPC_J004928.48+044100.1  null        L9    19.   L9
WISE_J004945.61+215120.0    null        T8.5  28.5  T8.5
SIPS_J0050-1538             L1:         11.   L0.5  10.5  L1:
0 голосов
/ 09 июня 2018

Ваше регулярное выражение ищет 0 или более пробельных символов.Попробуйте \ s +, чтобы обеспечить минимум 1 пробел.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...