помещать элементы списка в отдельные ячейки датафрейма - PullRequest
0 голосов
/ 16 апреля 2020

У меня есть список numpy массивов, где отдельный массив выглядит следующим образом:

[array([[-0.8129685 ,  0.25563928,  0.5257286 , ...,  0.27218387,
        -0.09186438,  0.21530187]], dtype=float32), array([[-0.41776586, -0.03817111,  0.8204172 , ...,  0.16926236,
         0.1923414 ,  0.18040611]], dtype=float32), array([[-0.70996654, -0.03073553,  0.74552304, ...,  0.52257764,
        -0.1465849 , -0.38585848]], dtype=float32), array([[-1.0497763 , -0.05266491,  0.69915617, ...,  0.24170516,
         0.05062697,  0.29804927]], dtype=float32), array([[-0.70316374,  0.22170547,  0.47574154, ...,  0.52260965,
        -1.2310463 ,  0.431722  ]], dtype=float32), array([[-0.72455716, -0.05363848,  0.8941862 , ...,  0.05577775,
         0.14195909, -0.0771163 ]], dtype=float32), array([[-0.45597026,  0.31754223,  0.72948986, ...,  0.40124443,
        -0.52186936,  0.54976016]], dtype=float32), array([[-0.64960825, -0.02850961,  0.79791856, ...,  0.26005346,
        -0.32073644, -0.1945045 ]], dtype=float32), array([[-0.6557834 ,  0.1716764 ,  0.938828  , ...,  1.0849419 ,
        -0.12322052, -0.38584358]], dtype=float32), array([[-0.41776586, -0.03817111,  0.8204172 , ...,  0.16926236,
         0.1923414 ,  0.18040611]], dtype=float32)]

Я хотел бы скопировать элементы массивов в кадр данных. Я передаю этот список массивов как переменную embeddings в кадр данных в четвертой строке.

это код, который я получил, но я не знаю, как это сделать для каждого элемента в списке ...

def createDataFrame(embeddings, data):
    sentences = data['Interest_Name']
    sentences_df = pd.DataFrame(sentences)
    embeddings_df = pd.DataFrame(embeddings) ### don't know how to get the list of arrays right :/
    print(embeddings_df)
    dataframe = sentences_df.join(embeddings_df)

    return dataframe

dataframe = createDataFrame(embeddings, data)

Заранее спасибо!

1 Ответ

0 голосов
/ 16 апреля 2020

emdeddings - это имена столбцов? данные приведены в списке? каждый массив numpy является столбцом в кадре данных? если я прав, попробуйте это:

# your given list of arrays
arr = [np.random.rand(5, 1), np.random.rand(5, 1), np.random.rand(5, 1)]
embeddings = list('abc')

arr = np.array(arr)
arr = reshape(3, 5).T
df = pd.DataFrame(arr, columns=embeddings)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...