1 Milllion Integers GroupBy - Возникновение - PullRequest
0 голосов
/ 09 октября 2018

Я создал 1 миллион случайных целых чисел от 1 до 100 и записал результаты в текстовый файл.

Results_File = open('RandomResults.txt','w')
for i in range(1000000):
    x = random.randint(1,100)
    Results_File.write(str(x) + "," + '\n')

Хорошо, это работает.Но я хотел найти вхождение каждого целого числа во весь набор данных.

Итак, я импортировал файл в новый сеанс Python и создал из данных фрейм данных.(Я также открыл csv и создал столбец заголовка «A», чтобы помочь перемещать данные в Pandas. (Вероятно, не было необходимости)

  df = pd.read_csv('RandomNumbers.csv','r') 
  df.sort_values(by=['A'])

Это где я застрял. Может кто-тоуказать мне правильное направление?

Я хочу посмотреть, как часто каждое число встречается в этом случайном распределении чисел.

Ответы [ 2 ]

0 голосов
/ 09 октября 2018

Надеюсь, это поможет.value_counts() функция панд делает это.

df['A'].value_counts()
0 голосов
/ 09 октября 2018

Вы можете сделать это, сначала сгруппировав по столбцу, а затем вызвав .size().

Таким образом, если столбец, содержащий значения, называется 'a', вы можете получитьфрейм данных, который содержит количество элементов на значение, с:

df.groupby('a').size()

Если я, например, запустил эксперимент с 10 000 элементов между 1 и 10, яполучил:

>>> df.groupby('a').size()
a
1,     1023
10,    1005
2,     1042
3,      951
4,     1046
5,      949
6,     1015
7,     1004
8,      996
9,      969
dtype: int64
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...