H2O Python - Как разрешить h2oframe для dataframe с правильно символ и дата / время - PullRequest
0 голосов
/ 05 июня 2018

У меня есть CSV-файл, и я хочу использовать H2O для DeepLearning.Но у него есть несколько китайских языков и дата, что когда я заканчиваю свою задачу Deeplearning, чтобы сохранить вывод в csv, он не может вернуться к исходным данным.

Я использую небольшие данные, чтобы показать мою проблему здесь.

 In[1]: df = pd.DataFrame({'datetime':['2016-12-17 00:00:00'],'time':['00:00:30'],'month':['月'], 'weekend':['周六']})
        print(df.dtypes)
        df
out[1]: datetime    object
        time        object
        month       object
        weekend     object
        dtype: object
             datetime   time              month weekend
        0   2016-12-17 00:00:00 00:00:30    月   周六 

In[2]: h2o_frame = h2o.H2OFrame(df);h2o_frame ;h2o_frame.types ;h2o_frame

C: \ Users \ thi \ Anaconda3 \ lib \ site-packages \ h2o \ utils \ shared_utils.py: 170: FutureWarning: метод .as_matrix будет удален в следующей версии.Вместо этого используйте .values.data = _handle_python_lists (python_obj.as_matrix (). tolist (), -1) [1]

out[2]: Parse progress: |█████████████████████████████████████████████████████████| 100%
                  datetime                time       month        weekend
        2016-12-17 00:00:00  1970-01-01 00:00:30    <0xA4EB>    <0xA9>P<0xA4BB>

время, когда я хочу это только 00:00:30, любой способ это исправить?

месяц и выходные. Я не нахожу способа, чтобы он показывал китайский язык, но я все еще заканчиваю свой глубокий анализ

Но когда я хочу позволить h2oframe вернуться к dataframe и сохранить в файл csv, это экономит <0xA4EB> для меня, но не , а дату и время меняют на int

 In[3]: dff = h2o_frame.as_data_frame();dff
out[3]:         datetime     time     month        weekend
        0   1481932800000   30000   <0xA4EB>    <0xA9>P<0xA4BB>
  • Как правильно вернуть символ из h2oframe в dataframe
  • как правильно вернутьdatetime от h2oframe до dataframe

Заранее спасибо.

1 Ответ

0 голосов
/ 05 июня 2018

Один из самых простых способов решить эту проблему - использовать для преобразования кадра pandas в H2OFrame аргумент column_types , как показано ниже:

In [69]: col_types
Out[69]: ['categorical', 'categorical', 'categorical', 'categorical']

In [70]: h2o_frame = h2o.H2OFrame(df,column_types=col_types);h2o_frame ;h2o_frame.types ;h2o_frame
Parse progress: |█████████████████████████████████████████████████████████████████████████████| 100%
Out[70]: 
datetime             month    time      weekend
-------------------  -------  --------  ---------
2016-12-17 00:00:00  月       00:00:30  周六

[1 row x 4 columns]


In [71]: dff = h2o_frame.as_data_frame();dff
Out[71]: 
              datetime month      time weekend
0  2016-12-17 00:00:00     月  00:00:30      周六

Надеюсь, это поможет вам .. !!

Ура .. !!

...