Мой вопрос настолько общий, что я почти уверен, что это может быть дубликат, но я не смог найти ответ ... За это я заранее прошу прощения!
У меня следующая проблема:
Рассмотрим набор данных pandas, полученный со следующими строками:
import numpy as np
import pandas as pd
dates = pd.date_range( '20130101', periods=6 )
df = pd.DataFrame( np.random.randn( 6, 4 ), index=dates, columns=list( 'ABCD' ) )
df2 = pd.DataFrame ( [["dog", "dog", "snake", "cat"],["mammel", "mammel", "reptilian", "mammel"]], columns=list('ABCD'))
df2 = df2.append(df)
, который дает следующую структуру:
A B C D
0 dog dog snake cat
1 mammel mammel reptilian mammel
2013-01-01 00:00:00 0.876641 -1.23665 0.375619 -0.642984
2013-01-02 00:00:00 -1.10135 0.264016 0.0893244 1.7381
2013-01-03 00:00:00 -0.551488 0.301711 -0.682017 1.4073
2013-01-04 00:00:00 -0.141452 -0.514909 -2.99863 -0.0283258
2013-01-05 00:00:00 -1.25555 1.1793 0.932212 -0.441398
2013-01-06 00:00:00 0.349649 -0.781957 0.0733772 0.810805
Я хотел бы иметь значения, соответствующие0 и 1 как атрибуты столбцов.Например, я хотел бы сохранить все столбцы, которые соответствуют mammel (A, B, D), но меня просто интересуют значения, соответствующие датам.
Итак, другими словами, я пытаюсь найтиспособ сделать подмножества исходных наборов данных через комбинации ключевых слов или значений (которые я называю здесь атрибутами).
Я верю, что то же самое возможно в структурах R-данных, но я не смог найти лучшего питонического / пандатическогоспособ сделать это!
Заранее благодарим за любую помощь!