Как преобразовать список Python в Python Dataframe - PullRequest
0 голосов
/ 30 января 2019

Я хочу преобразовать значения списка в Dataframe python, но мои значения заголовка находятся внутри списка.

значения, которые находятся внутри списка, выглядят так:

cols_head=['BATSMEN', '', 'R', 'B', '4s', '6s', 'SR', '', 'C Hemraj', 'c Mohammad Mithun b Mehidy Hasan Miraz', '9', '17', '2', '0', '52.94', '']

У меня естьудалил значения с веб-сайта espn, и теперь это оценочная карта, когда значения находятся внутри списка, я хочу преобразовать их в фрейм данных pandas.Когда я преобразовал список в фрейм данных, я получаю следующее:

              0
    0   BATSMEN
    1   Out
    2   R
    3   B
    4   4s
    5   6s
    6   SR
    7   
    8   C Hemraj
    9   c Mohammad Mithun b Mehidy Hasan Miraz
    10  9
    11  17
    12  2
    13  0
    14  52.94

от серийного номера 0 до 7, это столбцы фрейма данных

Это код, который я пыталсяпреобразовать значения

    cols_head=[x.text.strip() for x in cell]
    #print(cols_head)    
     List_values=cols_head[:-13]
    df=pd.DataFrame(List_values)

Я хочу, чтобы выходные данные кадра данных были такими:

         BATSMEN      Out               R    B    4s   6s    SR
  1    C Hemraj  C Mohammad Mithun      9    17   2     0    52.94

Ответы [ 2 ]

0 голосов
/ 30 января 2019

Вы можете использовать понимание списка.Это распространяется на предположение, что ваш список содержит произвольное количество строк в одном и том же формате.Обратите внимание, что на самом деле у вас есть 8 столбцов.Последний помечен пустой строкой.

data = ['BATSMEN', '', 'R', 'B', '4s', '6s', 'SR', '', 'C Hemraj', 'c Mohammad Mithun b Mehidy Hasan Miraz', '9', '17', '2', '0', '52.94', '']

n = 8
df = pd.DataFrame([data[n*i:n*(i+1)] for i in range(1, len(data) // n)],
                  columns=data[:n])

print(df)

#     BATSMEN                                          R   B 4s 6s     SR  
# 0  C Hemraj  c Mohammad Mithun b Mehidy Hasan Miraz  9  17  2  0  52.94  

print(df.columns)

# Index(['BATSMEN', '', 'R', 'B', '4s', '6s', 'SR', ''], dtype='object')
0 голосов
/ 30 января 2019

Это работает для данных, которые вы разместили.Его нужно немного подправить, если ваш список содержит несколько строк данных.

import pandas as pd

cols_head=['BATSMEN', '', 'R', 'B', '4s', '6s', 'SR', '', 'C Hemraj', 'c Mohammad Mithun b Mehidy Hasan Miraz', '9', '17', '2', '0', '52.94', '']
headers = cols_head[:7]
data = cols_head[8:-1]  # Ignores the two blanks at index 7 and 15
df = pd.DataFrame([data], columns=headers)

Вывод:

    BATSMEN                                          R   B 4s 6s     SR
0  C Hemraj  c Mohammad Mithun b Mehidy Hasan Miraz  9  17  2  0  52.94
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...