Я хочу иметь строки со списком элементов, сначала у меня был DataFrame с такой структурой:
╔═══════════════════════════════════╦════════════╦══════════╦═════════════╗
║ url ║ date ║ name ║ numMentions ║
║ www.newspaperarticle ║ 2018-12-31 ║ Bill ║ 2 ║
║ www.newspaperarticle ║ 2018-12-31 ║ Cosby ║ 3 ║
║ www.newspaperarticle ║ 2018-12-31 ║ New York ║ 1 ║
║
╚═══════════════════════════════════╩════════════╩══════════╩═════════════╝
Я изменил его в структуру, где слова в имени и числа в numMentions присоединяются один раз на URL / имя IDS, сгруппировав их:
df.groupby(['url','date'], as_index=False).agg({
'name': lambda x: list(x),
'numMentions': lambda x: list((map(str,x))),
'avgSalience':lambda x: list((map(str,x)))
})
И я получил следующий фрейм данных:
╔══════════════════════╦════════════╦═══════════════════════╦═════════════╗
║ url ║ date ║ name ║ numMentions ║
║ www.newspaperarticle ║ 2018-12-31 ║ [Bill,Cosby,NewYork] ║ [2,3,1] ║
╚══════════════════════╩════════════╩═══════════════════════╩═════════════╝
То, что я хочу, это либо возможность доступа к отдельным словам в списке потому что в настоящее время список - это просто элемент со всеми словами или структурой, как показано ниже:
╔═══════════════════════════════════╦════════════╦══════════╦═════════════╗
║ url ║ date ║ name ║ numMentions ║
║ www.newspaperarticle ║ 2018-12-31 ║ Bill ║ 2 ║
║ ║ Cosby ║ 3 ║
║ ║ New York ║ 1 ║
║
╚═══════════════════════════════════╩════════════╩══════════╩═════════════╝
Вот пример данных с 10 строками