некоторые столбцы в DataFrame - это Nan, python - PullRequest
1 голос
/ 19 февраля 2020

Я новичок с python, я извлек данные из твиттера и хочу поместить их в DataFrame.

, поэтому я написал эту строку кода:

import pandas as pd


data = pd.DataFrame(data=[tweet.text for tweet in tweets],columns=['tweets'])

и я попытался добавить больше столбцов, используя этот код:

import numpy as np


data['len'] = np.array([len(tweet.text)for tweet in tweets])
data['ID'] = np.array([tweet.id for tweet in tweets])

, но появляется ошибка:

Длина значений не соответствует длине индекса,

даже длина равна, и я проверил это, используя sum() метод. Я искал и нашел некоторые решения, которые используют метод concat(), и он работает, но когда я печатаю информационный кадр, len и ID - это Nan, поэтому я проверил это, поместив печать в l oop

 for tweet in tweets:
    print(len(tweet.text))
    print(tweet.id)

и это содержит значение не Nan

так в чем проблема и как я могу ее решить?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...