Я новичок с python, я извлек данные из твиттера и хочу поместить их в DataFrame.
, поэтому я написал эту строку кода:
import pandas as pd
data = pd.DataFrame(data=[tweet.text for tweet in tweets],columns=['tweets'])
и я попытался добавить больше столбцов, используя этот код:
import numpy as np
data['len'] = np.array([len(tweet.text)for tweet in tweets])
data['ID'] = np.array([tweet.id for tweet in tweets])
, но появляется ошибка:
Длина значений не соответствует длине индекса,
даже длина равна, и я проверил это, используя sum()
метод. Я искал и нашел некоторые решения, которые используют метод concat()
, и он работает, но когда я печатаю информационный кадр, len и ID - это Nan, поэтому я проверил это, поместив печать в l oop
for tweet in tweets:
print(len(tweet.text))
print(tweet.id)
и это содержит значение не Nan
так в чем проблема и как я могу ее решить?