NumPy: довольно печатные табличные данные - PullRequest
14 голосов
/ 15 марта 2012

Я хотел бы напечатать данные табличного массива NumPy, чтобы он выглядел хорошо. Консоли R и базы данных, похоже, демонстрируют хорошие способности для этого. Однако встроенная печать табличных массивов в NumPy выглядит как мусор:

import numpy as np
dat_dtype = {
    'names' : ('column_one', 'col_two', 'column_3'),
    'formats' : ('i', 'd', '|S12')}
dat = np.zeros(4, dat_dtype)
dat['column_one'] = range(4)
dat['col_two'] = 10**(-np.arange(4, dtype='d') - 4)
dat['column_3'] = 'ABCD'
dat['column_3'][2] = 'long string'

print(dat)
# [(0, 0.0001, 'ABCD') (1, 1.0000000000000001e-005, 'ABCD')
#  (2, 9.9999999999999995e-007, 'long string')
#  (3, 9.9999999999999995e-008, 'ABCD')]

print(repr(dat))
# array([(0, 0.0001, 'ABCD'), (1, 1.0000000000000001e-005, 'ABCD'),
#        (2, 9.9999999999999995e-007, 'long string'),
#        (3, 9.9999999999999995e-008, 'ABCD')], 
#       dtype=[('column_one', '<i4'), ('col_two', '<f8'), ('column_3', '|S12')])

Мне бы хотелось что-то, что больше похоже на то, что выдает база данных, например, в стиле postgres:

 column_one | col_two |  column_3
------------+---------+-------------
          0 |  0.0001 | ABCD
          1 |  1e-005 | long string
          2 |  1e-008 | ABCD
          3 |  1e-007 | ABCD

Есть ли хорошие сторонние библиотеки Python для форматирования красивых таблиц ASCII?

Я использую Python 2.5, NumPy 1.3.0.

Ответы [ 4 ]

21 голосов
/ 15 марта 2012

У меня, кажется, хороший вывод с prettytable :

from prettytable import PrettyTable
x = PrettyTable(dat.dtype.names)
for row in dat:
    x.add_row(row)
# Change some column alignments; default was 'c'
x.align['column_one'] = 'r'
x.align['col_two'] = 'r'
x.align['column_3'] = 'l'

И вывод не плохой. Существует даже переключатель border, среди нескольких других вариантов:

>>> print(x)
+------------+---------+-------------+
| column_one | col_two |   column_3  |
+------------+---------+-------------+
|          0 |  0.0001 | ABCD        |
|          1 |  1e-005 | ABCD        |
|          2 |  1e-006 | long string |
|          3 |  1e-007 | ABCD        |
+------------+---------+-------------+
>>> print(x.get_string(border=False))
 column_one  col_two    column_3  
          0   0.0001  ABCD        
          1   1e-005  ABCD        
          2   1e-006  long string 
          3   1e-007  ABCD        
6 голосов
/ 13 ноября 2017

Пакет tabulate прекрасно работает для массивов Numpy:

import numpy as np
from tabulate import tabulate

m = np.array([[1, 2, 3], [4, 5, 6]])
headers = ["col 1", "col 2", "col 3"]

# tabulate data
table = tabulate(m, headers, tablefmt="fancy_grid")

# output
print(table)

(Выше код Python 3; для Python 2 добавьте from __future__ import print_function вверху скрипта)

Выход:

╒═════════╤═════════╤═════════╕
│   col 1 │   col 2 │   col 3 │
╞═════════╪═════════╪═════════╡
│       1 │       2 │       3 │
├─────────┼─────────┼─────────┤
│       4 │       5 │       6 │
╘═════════╧═════════╧═════════╛

Пакет устанавливается через pip:

$ pip install tabulate     # (use pip3 for Python 3 on some systems)
6 голосов
/ 15 марта 2012

вы можете воспользоваться пониманием массива и использовать строки формата printf:

for c1, c2, c3 in dat:  
    print "%2f | %8e | %s" % (c1, c2, c3)

https://en.wikipedia.org/wiki/Printf_format_string
И вы можете получить еще больше индивидуальных настроек, если перейдете на версию 2.7

5 голосов
/ 15 марта 2012

Возможно, вы захотите проверить Pandas, которая имеет много приятных функций для работы с табличными данными и, кажется, лучше раскладывает при печати (она разработана как замена Python для R):

http://pandas.pydata.org/

...