Python: Как использовать NumPy для извлечения данных тренда / хэштега из постов Twitter? - PullRequest
0 голосов
/ 12 апреля 2019

Моя цель - использовать массивные массивы DataFrame для поиска данных о интернет-трафике через хештеги Twitter из Twitter API (например, моя учетная запись Twitter создает сообщение с хэштегом, а numpy принимает данные о людях, которые приходят на мой сайт).пост в результате указанного хэштега).Я считаю, что это возможно аналогично тому, как я могу собрать другие данные, касающиеся публикации, такие как дата публикации, география и т. Д. Я могу выполнить процесс, я просто не знаю, какие значения нужно заполнить. Какие значенияя могу вставить, чтобы понять хэштег / данные тренда в посте Twitter?

Скорее всего, это моя глупость, но я просто не смог легко найти этот тип информации.Вот пример того, как выглядят мои текущие массивы массивов DataFrame.

    df['date'] = np.array([tweet.created_at for tweet in tweets])
    df['likes'] = np.array([tweet.favorite_count for tweet in tweets])
    df['retweets'] = np.array([tweet.retweet_count for tweet in tweets])

    df ['x'] = np.array([y(tweet.z) for tweet in tweets])

Весь остальной код (например, tweepy.OAuth и tweepy.Streamlistener) работает как задумано, это всего лишь вопросценности.Эта последняя строка является строкой примера df, с которой обычно идут значения.По сути, я ищу значения x, y и / или z, чтобы узнать, сколько людей отвечает на сообщение из-за хэштега (ов) в сообщении.

Это сценарий IЯ надеюсь достичь: аккаунт моей компании размещает примерно 5 хэштегов в одном посте.Люди обнаруживают пост из этих хэштегов, а также любят и ретвитят.Numpy берет эту информацию, и я хочу видеть, сколько людей приходит с каждого хэштега.Цель состоит в том, чтобы понять, какие хэштеги работают лучше всего при определенных переменных (время суток, контент, демография и т. Д.)

...