pandas2ri вызывает Процесс завершен с кодом выхода -1073741819 (0xC0000005) - PullRequest
0 голосов
/ 03 марта 2020

Я использую python пакет rpy2, и в моем коде у меня есть pandas Data Frame, который мне нужно преобразовать обратно в R data.frame. Приведенный ниже код определяет функцию:

    def prepare_data(self, X_train, y_train):
        '''
        concatenates X_train_inner and y_train_inner into one, and make them a data frame
        so we are able to process the data frame by SMOGN, RandUnder, GN, or SMOTER
        '''

        # print('preparing data')
        # reshape + rename
        X_train_samp = X_train
        y_train_samp = y_train.reshape(-1, 1)

        print('before concatenate')
        # combine two numpy arrays together into one numpy array
        combined = np.concatenate((X_train_samp, y_train_samp), axis=1)
        print('after concatenate')

        print('before df_combined')
        # transform X_train + y_train into a pandas dataframe
        column_names = self.other + [self.target_variable]
        df_combined = pd.DataFrame(combined, columns=column_names)
        print('after df_combined')

        print('before pandas2ri')
        # convert the combined pandas dataframe to R Data.Frame
        df_combined = pandas2ri.py2ri(df_combined)
        print('after pandas2ri')


        # print('finished preparing data')

        return df_combined

После тщательной отладки моей программы я понимаю, что следующая строка:

df_combined = pandas2ri.py2ri(df_combined)

вызывает

Process закончил с кодом выхода -1073741819 (0xC0000005)

У меня есть следующее:

  • Я использую PyCharm 2018.3.3
  • У меня есть python 3.6.7
  • У меня есть pandas 0.24.0
  • У меня есть версия 2.9.5 rpy2 (я скачал скомпилированный двоичный файл с здесь )
  • Я на windows (windows 10)

Я застрял на 4 дня с этим. Что я должен сделать, чтобы избежать этого? Я попытался запустить из cmd, код также ломается, но без запроса сообщения Process finished with exit code -1073741819 (0xC0000005)

...