2-й numpy ndarray, показывающий 1-ю форму - PullRequest
0 голосов
/ 04 ноября 2019

Я получаю пустой массив из следующей функции

def get_word_vec_norm(post):
    doc = nlp(post)
    word_vec = []
    index = 1
    for token in doc:
        word_vec.append(token.vector_norm)
        index = index + 1
        if index>2:
            break
#     return word_vec
    return np.asarray(word_vec)

после вызова этой функции

X = data['cleaned_post'].apply(get_word_vec_norm)

Теперь я ожидал, что форма X равна (18,2), но этопоказывая (18, 1), как показано на следующем изображении. enter image description here

Я думаю, что-то сделал что-то не так. Кто-нибудь, пожалуйста, поправьте меня. Я был бы благодарен. спасибо.

1 Ответ

0 голосов
/ 04 ноября 2019

Если вы загрузите матрицу X или DataFrame, я мог бы предоставить более подробный ответ.

В функции, которую вы используете word_vec.append(token.vector_norm), вы добавляете элементы в список.

и затем вы делаете: np.asarray(word_vec), т.е. вы конвертируете список в массив numpy

Это приводит к наблюдаемому результату.

...