Как сформировать список кортежей из столбца Dataframe - PullRequest
0 голосов
/ 18 января 2019

У меня есть следующий файл данных df pandas с первыми несколькими записями:

     Input      Output
0    hj1234        2
1    gu0998        5
2    iu5678        7
3    56h781        11

Мне нужно преобразовать его в 2 отдельных набора списков, выглядящих так:

my_inputs = [
   (h, j, 1, 2, 3, 4), 
   (g, u, 0, 9, 9, 8), 
   (i, u, 5, 6, 7, 8), 
   (5, 6, h, 7, 8, 1)]'
my_outputs =[(2,),
             (5,),
             (7,),
             (11,)]

Я попытался сделать это в Excel, используя функцию сцепления, однако максимальная длина функции равна числу символов, которое можно объединить в одну строку. И поэтому я пытаюсь сделать это в Python. Пожалуйста, помогите

1 Ответ

0 голосов
/ 18 января 2019

Если вы действительно хотите, это можно сделать, используя applymap и zip.

a, b = map(list, zip(*df.applymap(lambda x: (x, )).values.tolist()))   
a = list(map(tuple, [a_[0] for a_ in a]))

a
# [('h', 'j', '1', '2', '3', '4'),
#  ('g', 'u', '0', '9', '9', '8'),
#  ('i', 'u', '5', '6', '7', '8'),
#  ('5', '6', 'h', '7', '8', '1')]     
b
# [(2,), (5,), (7,), (11,)]

Другой вариант - просто обрабатывать каждый столбец отдельно.

a = list(map(tuple, df['Input']))
b = [(x, ) for x in df['Output']]

a
# [('h', 'j', '1', '2', '3', '4'),
#  ('g', 'u', '0', '9', '9', '8'),
#  ('i', 'u', '5', '6', '7', '8'),
#  ('5', '6', 'h', '7', '8', '1')]   
b
# [(2,), (5,), (7,), (11,)]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...