Я создал функцию python, которая делает то, что мне нужно, взяв формулы из этого pdf
Надеюсь, это поможет сообществу. Пожалуйста, предоставьте исправления, если я ошибаюсь.
Примечание: это работает для значений в интервале [0,2pi] или 360 градусов.
import pandas as pd
import numpy as np
from scipy.stats import chi2
def random_dates(start, end, n, unit='D', seed=None):
if not seed:
np.random.seed(0)
ndays = (end - start).days + 1
return pd.to_timedelta(np.random.rand(n) * ndays, unit=unit) + start
def vonmises(df, field):
N = len(df[field])
s = np.sum(np.sin(df[field]))
c = np.sum(np.cos(df[field]))
sbar = (1/N)*s
cbar = (1/N)*c
if cbar > 0:
if sbar >= 0:
df['mu_vm'] = np.arctan(sbar/cbar)
else:
df['mu_vm'] = np.arctan(sbar/cbar) + 2*np.pi
elif cbar < 0:
df['mu_vm'] = np.arctan(sbar/cbar) + np.pi
else:
df['mu_vm'] = np.nan
R = np.sqrt(c**2 + s**2)
Rbar = (1/N)*R
if Rbar < 0.53:
kstar = 2*Rbar + Rbar**3 + 5*(Rbar**5)/6
elif Rbar >= 0.85:
kstar = 1/(3*Rbar -4*(Rbar**2) + Rbar**3)
else:
kstar = -0.4 + 1.39*Rbar + 0.43/(1-Rbar)
if N<=15:
if kstar < 2:
df['kappa_vm'] = np.max([kstar - 2/(N*kstar),0])
else:
df['kappa_vm'] = ((N-1)**3)*kstar/(N*(N**2+1))
else:
df['kappa_vm'] = kstar
if Rbar <= 2/3:
df['vm_plus'] = df['mu_vm'] + np.arccos(np.sqrt(2*N*(2*(R**2) -
N*chi2.isf(0.9,1))/((R**2)*(4*N - chi2.isf(0.9,1)))))
df['vm_minus'] = df['mu_vm'] - np.arccos(np.sqrt(2*N*(2*(R**2) -
N*chi2.isf(0.9,1))/((R**2)*(4*N - chi2.isf(0.9,1)))))
else:
df['vm_plus'] = df['mu_vm'] + np.arccos(np.sqrt((N**2) -
((N**2) - (R**2))*np.exp(chi2.isf(0.9,1)/N))/R)
df['vm_minus'] = df['mu_vm'] - np.arccos(np.sqrt((N**2) -
((N**2) - (R**2))*np.exp(chi2.isf(0.9,1)/N))/R)
df['vm_conft'] = np.where((df['vm_plus'] < df[field]) |
(df['vm_minus'] > df[field]), True, False)
return df
df = pd.concat([pd.DataFrame({'A':[1,1,1,1,1,2,2,2,2,2]}), pd.DataFrame({'B':random_dates(pd.to_datetime('2015-01-01'), pd.to_datetime('2018-01-01'), 10)})],axis=1)
df['C'] = (df['B'].dt.hour*60+df['B'].dt.minute)*60 + df['B'].dt.second
df['D'] = df['C']*2*np.pi/(24*60*60)
df = df.groupby('A').apply(lambda x : vonmises(x, 'D'))
Чтобы вернуться к часам, например,просто умножьте на 24 и разделите на 2pi