Question

Мне нужно сравнить два столбца: «EMAIL» и «LOCATION».
Я использую электронную почту, потому что она более точна, чем имя для этой проблемы.
Моя цель - найти общее количество мест, в которых работал каждый человек, просуммировать общее количество мест, чтобы выбрать, на какой лист будут записаны данные, и скопировать исходные данные на новый лист (вкладку).
Мне нужно скопировать исходные данные со всеми повторяющимися местоположениями, и именно здесь эта проблема меня озадачивает.

Пришлось использовать изображения, потому что сообщение было помечено как спам

Лист Excel (ОБРАЗЕЦ), который я читаю как фрейм данных: Образец электронной таблицы Excel

Пример:

TOMAPPLES@EXAMPLE.COM работал в WENDYS, FRANKS HUT и WALMART - это суммирует до 3 различных мест, которые я бы добавил в новый лист под названием SHEET: 3 В разных местах

SJONES22@GMAIL.COM работали в LONDONS TENT и YO UTUBE - это 2 разных местоположения, которые я бы добавил на новый лист под названием SHEET: 2 разных местоположения

MONTYJ@EXAMPLE.COM работал только в WALMART - этот пользователь будет добавлен в ЛИСТ: 1 Расположение

Результат:

данные скопированы на новые листы

Спасибо, что нашли время изучить мою проблему =)

Hitesh · Answer 1 · 27 мая 2020

Привет. Проверьте строки ниже, если они вам подходят.

import pandas as pd
df = pd.read_excel('sample.xlsx')

df1 = df.groupby(['Name','Location','Job']).count().reset_index()

# this is long line
df2 = df.groupby(['Name','Location','Job','Email']).agg({'Location':'count','Email':'count'}).rename(columns={'Location':'Location Count','Email':'Email Count'}).reset_index()

print(df1)
print('\n\n')
print(df2)

ниже приведены столбцы изменения вывода, чтобы проверить другие варианты

df1

        Name Location      Job  Email
0          Monty  Jakarta  Manager      1
1          Monty   Mumbai  Manager      1
2  Sahara Jonesh    Paris     Cook      2
3        Tom App  Jakarta    Buser      1
4        Tom App    Paris    Buser      2

df2 все столбцы

            Name Location  ... Location Count Email Count
0          Monty  Jakarta  ...              1           1
1          Monty   Mumbai  ...              1           1
2  Sahara Jonesh    Paris  ...              2           2
3        Tom App  Jakarta  ...              1           1
4        Tom App    Paris  ...              2           2

Pythom: Сравните 2 столбца и запишите данные в листы Excel

Лист 2

Лист 3

Лист 4

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.