У меня есть фрейм данных с ответами (интернет-опрос цветов).фрейм данных выглядит так:
У меня есть фрейм данных с ответами (интернет-опрос цветов).первые пять строк выглядят так:
id user r g b colorname
0 1 72 100 175 pastel blue
1 2 204 177 246 faint violet
2 3 182 226 245 baby blue
3 4 130 64 234 purple
4 5 275 49 234 blue
с
data['colorname'].nunique()
и
data.colorname.value_counts()
Я вижу, что существует 181270 уникальных ответов и их количество,Я хотел бы удалить все ответы, которые не входят в топ-100 из исходного фрейма данных, но git застрял здесь.
#libraries
import pandas as pd
import numpy as np
from numpy import array
data = pd.read_csv('color_survey_answers.csv', delimiter='\t')
data.head()
data['colorname'].nunique()
data.colorname.value_counts()