Существует ручной процесс объединения элементов из таблицы, когда вы хотите создать более глобальный набор. Идея состоит в том, чтобы использовать инструменты Pandas, чтобы сделать его более простым и автономным.
Давайте рассмотрим следующий пример, где у вас есть следующая таблица с информацией о некоторых университетах и студентах, у которых есть отличные результаты в каждом семестре, в течение четвертого семестра магистра. Как видите, есть некоторые значения "nan".
1 Semester 2 Semester 3 Semester 4 Semester
Harvard Oliver nan Michael nan
MIT Noah Connor Callum George
Jack nan nan Oscar
Stanford Harry nan Kyle nan
Liam nan Reece nan
Georgia Jake Charlie nan nan
Jacob Damian nan nan
Mason Daniel nan nan
Идея состоит в том, чтобы показать таблицу на каждого мастера, поэтому вам нужно объединить каждый семестр и создать один столбец, как показано в следующей таблице
Master
Harvard Oliver
Michael
MIT Noah
Jack
Connor
Callum
George
Oscar
Stanford Harry
Liam
Kyle
Reece
Georgia Jake
Jacob
Mason
Charlie
Damian
Daniel
Я пробовал много вариантов, таких как объединение, объединение и объединение, но ни один из них не работал для меня.
import pandas as pd
data = pd.read_csv('/home/datasci/PEC/prog_datasci_4/data/university.csv')
sub_table= data[['university','1_semester','2_semester',
'3_semester','4_semester']]
retri = sub_table.set_index('university')
location_battle =
retri.astype(str).groupby(['university','1_semester','2_semester',
'3_semester','4_semester'])
Моя цель - объединить столбцы первой таблицы (семестр 1,2,3,4) и создать один столбец, не считая значения "nan"