(Приведение) ошибок с использованием функций extract_ (релевантных_) из tsfresh - PullRequest
1 голос
/ 06 марта 2019

Испытание пакета Python tsfresh У меня возникают проблемы на первых шагах Учитывая серию, как (автоматически) сделать функции для него? Этот фрагмент кода выдает разные ошибки в зависимости от того, какую часть я пытаюсь выполнить.

import tsfresh
import pandas as pd
import numpy as np
#tfX, tfy = tsfresh.utilities.dataframe_functions.make_forecasting_frame(pd.Series(np.random.randn(1000)/50), kind='float64', max_timeshift=50, rolling_direction=1)
#rf = tsfresh.extract_relevant_features(tfX, y=tfy, n_jobs=1, column_id='id')
tfX, tfy = tsfresh.utilities.dataframe_functions.make_forecasting_frame(pd.Series(np.random.randn(1000)/50), kind=1, max_timeshift=50, rolling_direction=1)
rf = tsfresh.extract_relevant_features(tfX, y=tfy, n_jobs=1, column_id='id')

Ошибки в первом случае

"" "Traceback (последний вызов был последним): файл" C: \ Users \ user \ Anaconda3 \ envs \ env1 \ lib \ multiprocessing \ pool.py ", строка 119, в работнике result = (True, func (* args, ** kwds)) Файл "C: \ Users \ user \ Anaconda3 \ envs \ env1 \ lib \ site-packages \ tsfresh \ utilities \ distribution.py", строка 38 в _function_with_partly_reduce results = list (itertools.chain.from_iterable (results)) Файл "C: \ Users \ user \ Anaconda3 \ envs \ env1 \ lib \ site-packages \ tsfresh \ utilities \ distribution.py", строка 37, в Результаты = (map_function (chunk, ** kwargs) для chunk в chunk_list) Файл "C: \ Users \ пользователь \ Anaconda3 \ envs \ ENV1 \ Lib \ сайт-пакеты \ tsfresh \ feature_extraction \ extraction.py", строка 358, в _do_extraction_on_chunk список возврата (_f ()) Файл "C: \ Users \ user \ Anaconda3 \ envs \ env1 \ lib \ site-packages \ tsfresh \ feature_extraction \ extract.py", строка 350, в _f result = [("", func (data))] Файл "C: \ Users \ user \ Anaconda3 \ envs \ env1 \ lib \ site-packages \ tsfresh \ feature_extraction \ feature_calculators.py", строка 193, в variance_larger_than_standard_deviation y = np.var (x) Файл "C: \ Users \ user \ Anaconda3 \ envs \ env1 \ lib \ site-packages \ numpy \ core \ fromnumeric.py", линия 3157, в вар ** kwargs) Файл "C: \ Users \ user \ Anaconda3 \ envs \ env1 \ lib \ site-packages \ numpy \ core_methods.py", линия 110, в _var arrmean, rcount, out = arrmean, casting = 'unsafe', subok = False) TypeError: неподдерживаемые типы операндов для /: 'str' и 'int' "" "

и во втором случае

"" "Traceback (последний вызов был последним): файл Строка "C: \ Users \ user \ Anaconda3 \ envs \ env1 \ lib \ multiprocessing \ pool.py" 119, в работнике result = (True, func (* args, ** kwds)) Файл "C: \ Users \ user \ Anaconda3 \ envs \ env1 \ lib \ site-packages \ tsfresh \ utilities \ distribution.py", строка 38 в _function_with_partly_reduce results = list (itertools.chain.from_iterable (results)) Файл "C: \ Users \ user \ Anaconda3 \ envs \ env1 \ lib \ site-packages \ tsfresh \ utilities \ distribution.py", строка 37, в Результаты = (map_function (chunk, ** kwargs) для chunk в chunk_list) Файл "C: \ Users \ пользователь \ Anaconda3 \ envs \ ENV1 \ Lib \ сайт-пакеты \ tsfresh \ feature_extraction \ extraction.py", строка 358, в _do_extraction_on_chunk список возврата (_f ()) Файл "C: \ Users \ user \ Anaconda3 \ envs \ env1 \ lib \ site-packages \ tsfresh \ feature_extraction \ extract.py", строка 345, в _f result = func (data, param = parameter_list) Файл "C: \ Users \ user \ Anaconda3 \ envs \ env1 \ lib \ site-packages \ tsfresh \ feature_extraction \ feature_calculators.py", строка 1752, в friedrich_coefficients coeff = _estimate_friedrich_coefficients (x, m, r) Файл "C: \ Users \ user \ Anaconda3 \ envs \ env1 \ lib \ site-packages \ tsfresh \ feature_extraction \ feature_calculators.py", строка 145, в _estimate_friedrich_coefficients result.dropna (inplace = True) Файл "C: \ Users \ user \ Anaconda3 \ envs \ env1 \ lib \ site-packages \ pandas \ core \ frame.py", линия 4598, в дропне result = self.loc (axis = axis) [mask] Файл "C: \ Users \ user \ Anaconda3 \ envs \ env1 \ lib \ site-packages \ pandas \ core \ indexing.py", строка 1500, в getitem вернуть файл self._getitem_axis (Maybe_callable, axis = axis) Файл "C: \ Users \ user \ Anaconda3 \ envs \ env1 \ lib \ site-packages \ pandas \ core \ indexing.py", строка 1859, в _getitem_axis if is_iterator (key): файл "C: \ Users \ user \ Anaconda3 \ envs \ env1 \ lib \ site-packages \ pandas \ core \ dtypes \ inference.py", строка 157, в is_iterator return hasattr (obj, ' next ') Файл "C: \ Users \ user \ Anaconda3 \ envs \ env1 \ lib \ site-packages \ pandas \ core \ generic.py", строка 5065, в getattr если self._info_axis._can_hold_identifiers_and_holds_name (name): файл"C: \ Users \ пользователь \ Anaconda3 \ envs \ ENV1 \ Lib \ сайт-пакеты \ панды \ ядро ​​\ индексы \ base.py", строка 3984, в _can_hold_identifiers_and_holds_name вернуть имя в self Файл "C: \ Users \ user \ Anaconda3 \ envs \ env1 \ lib \ site-packages \ pandas \ core \ indexes \ category.py", строка 327, в содержит return содержит (self, key, container = self._engine) файл "C: \ Users \ user \ Anaconda3 \ envs \ env1 \ lib \ site-packages \ pandas \ core \ arrays \ categoryorical.py", строка 188 содержит loc = cat.categories.get_loc (key) Файл "C: \ Users \ user \ Anaconda3 \ envs \ env1 \ lib \ site-packages \ pandas \ core \ indexes \ interval.py", строка 770, в get_loc начать, остановить = файл self._find_non_overlapping_monotonic_bounds (ключ) "C: \ Users \ пользователь \ Anaconda3 \ envs \ ENV1 \ Lib \ сайт-пакеты \ панды \ ядро ​​\ индексы \ interval.py", строка 717, в _find_non_overlapping_monotonic_bounds start = self._searchsorted_monotonic (key, 'left') Файл "C: \ Users \ user \ Anaconda3 \ envs \ env1 \ lib \ site-packages \ pandas \ core \ indexes \ interval.py", строка 681, в _searchsorted_monotonic вернуть sub_idx._searchsorted_monotonic (метка, сторона) Файл "C: \ Users \ user \ Anaconda3 \ envs \ env1 \ lib \ site-packages \ pandas \ core \ indexes \ base.py", строка 4755, в _searchsorted_monotonic вернуть self.searchsorted (метка, сторона = сторона) Файл "C: \ Users \ user \ Anaconda3 \ envs \ env1 \ lib \ site-packages \ pandas \ core \ base.py", строка 1501, в поиске вернуть self._values.searchsorted (значение, сторона = сторона, сортировщик = сортировщик). TypeError: Невозможно привести данные массива из dtype ('float64') в DTYPE (»

np. версия , tsfresh. версия («1.15.4», «неизвестно»). Я установил tsfresh, используя conda, вероятно, из conda-forge. Я на Windows 10. Использование другого ядра с np. версия , tsfresh. версия ('1.15.4', '0.11.2') приводят к тем же результатам.

Попытка первой пары ячеек из timeseries_forecasting_basic_example.ipynb также приводит к ошибке приведения.

1 Ответ

1 голос
/ 07 марта 2019

Исправлено.Либо версия на conda (-forge), либо одна из зависимостей была проблемой.Таким образом, используя «conda uninstall tsfresh», «conda install patsy future шесть tqdm» и «pip install tsfresh» вместе сделали свое дело.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...