Использование полифайта на панде и затем добавление результатов в новые столбцы - PullRequest
0 голосов
/ 02 июля 2018

У меня есть такой фрейм данных. Для каждого Id у меня есть (x1, x2), (y1, y2). Я хочу передать их polyfit (), получить наклон и точку пересечения и добавить их в качестве новых столбцов.

    Id        x         y
    1     0.79978   0.018255
    1     1.19983   0.020963
    2     2.39998   0.029006
    2     2.79995   0.033004
    3     1.79965   0.021489
    3     2.19969   0.024194
    4     1.19981   0.019338
    4     1.59981   0.022200
    5     1.79971   0.025629
    5     2.19974   0.028681

Мне действительно нужна помощь с группировкой правильных строк и предоставлением их в polyfit. Я боролся с этим. Любая помощь будет приветствоваться.

1 Ответ

0 голосов
/ 02 июля 2018

Вы можете groupby и применить подгонку в каждой группе. Во-первых, установите индекс, чтобы позже избежать слияния.

import pandas as pd
import numpy as np

df = df.set_index('Id')
df['fit'] = df.groupby('Id').apply(lambda x: np.polyfit(x.x, x.y, 1))

df сейчас:

          x         y                                           fit
Id                                                                 
1   0.79978  0.018255  [0.0067691538557680215, 0.01284116612923385]
1   1.19983  0.020963  [0.0067691538557680215, 0.01284116612923385]
2   2.39998  0.029006   [0.00999574968122608, 0.005016400680051043]
2   2.79995  0.033004   [0.00999574968122608, 0.005016400680051043]
3   1.79965  0.021489  [0.006761823817618233, 0.009320083766623343]
3   2.19969  0.024194  [0.006761823817618233, 0.009320083766623343]
...

Если вам нужны отдельные столбцы для каждой детали в отдельности, вы можете применить pd.Series

df[['slope', 'intercept']] = df.fit.apply(pd.Series)
df = df.drop(columns='fit').reset_index()

df сейчас:

   Id        x         y     slope  intercept
0   1  0.79978  0.018255  0.006769   0.012841
1   1  1.19983  0.020963  0.006769   0.012841
2   2  2.39998  0.029006  0.009996   0.005016
3   2  2.79995  0.033004  0.009996   0.005016
4   3  1.79965  0.021489  0.006762   0.009320
5   3  2.19969  0.024194  0.006762   0.009320
6   4  1.19981  0.019338  0.007155   0.010753
7   4  1.59981  0.022200  0.007155   0.010753
8   5  1.79971  0.025629  0.007629   0.011898
9   5  2.19974  0.028681  0.007629   0.011898
...