фрейм с ответами, как сохранить только первые 100 ответов - PullRequest
0 голосов
/ 15 февраля 2019

У меня есть фрейм данных с ответами (интернет-опрос цветов).фрейм данных выглядит так:

У меня есть фрейм данных с ответами (интернет-опрос цветов).первые пять строк выглядят так:

id  user r   g   b   colorname
0   1    72  100 175 pastel blue
1   2    204 177 246 faint violet
2   3    182 226 245 baby blue
3   4    130 64  234 purple
4   5    275 49  234 blue

с

data['colorname'].nunique()

и

data.colorname.value_counts() 

Я вижу, что существует 181270 уникальных ответов и их количество,Я хотел бы удалить все ответы, которые не входят в топ-100 из исходного фрейма данных, но git застрял здесь.

#libraries
import pandas as pd
import numpy as np
from numpy import array

data = pd.read_csv('color_survey_answers.csv',  delimiter='\t')
data.head()

data['colorname'].nunique()

data.colorname.value_counts()

1 Ответ

0 голосов
/ 15 февраля 2019

Можете ли вы попробовать следующее:

data[data.colorname.isin(data.colorname.value_counts()[:100].index)]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...