Я хочу выполнить ту же операцию для столбца в моем фрейме данных - PullRequest
0 голосов
/ 20 октября 2019

введите описание изображения здесь

Как видите, CallId повторяется, но данные (время) - нет. Мне нужно знать или самое короткое время каждого CallId.

введите описание изображения здесь

Я получу самый короткий результат времени, когда я укажу CallId, но он будет оченьтрудоемкий, когда у меня более 550 различных CallId. Я новичок в Python, но думаю, у него есть более простой способ решить эту проблему.

1 Ответ

0 голосов
/ 20 октября 2019

Вы можете использовать pandas.Series.unique в столбце CallId. Это даст вам набор всех уникальных значений в этом столбце. Затем зациклите этот результат и pandas.DataFrame.query DataFrame для каждого уникального значения, чтобы получить субкадры данных, содержащие только записи для каждого уникального CallId. Затем вычислите минимум столбца Data в запрашиваемом кадре данных:

# all unique CallId's
unique_callids = entrou.CallId.unique()
# loop over the unique CallId values
for ucid in unique_callids:
    # query the main dataframe to get a sub-dataframe of only CallId == ucid
    ucid_entrou = entrou.query("CallId == {}".format(ucid))
    # calculate the minimum of `Data` for this sub-dataframe
    min_ucid = ucid_entrou.Data.min()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...