Какие хорошие инструменты для измерения IO и выявления узких мест в Linux? - PullRequest
3 голосов
/ 22 мая 2009

Я пытаюсь сделать некоторые настройки для Oracle на Linux-системах, живущих на основе инфраструктуры SAN. Я специально искал инструменты, которые позволили бы нам профилировать ввод-вывод для каждого процесса (или для каждого дерева процессов было бы еще лучше). Мои вопросы?

  • Какие инструменты будут рекомендованы для такого рода задач?
  • Какие еще полезные метрики мне нужно измерить в инфраструктуре на основе SAN?

Ответы [ 6 ]

2 голосов
/ 22 мая 2009

Я использовал «iotop» с отличными результатами. Он получает конкретную информацию для каждого процесса с использованием ввода-вывода.

Работает как "top"

http://guichaz.free.fr/iotop/

Хотя я не уверен, что было бы разумно использовать его из Linux-бокса, в котором смонтировано SAN, или если вам нужен инструмент, который мог бы работать внутри SAN.

1 голос
/ 22 мая 2009

Как только вы начали специализироваться, я обнаружил, что проще всего написать несколько пользовательских сценариев, которые извлекают информацию из файлов в /proc.

.

Если вы анализируете, для которого у вас еще нет инструмента, который дает вам точный отчет, который вам нужен, вы, вероятно, в конечном итоге все равно будете выполнять некоторые сценарии, и большинство инструментов, которые вы используете под Linux просто собирается в / proc получить информацию в любом случае, а затем переформатировать ее для вас.

Если вы больше разбираетесь в работе с базами данных, то извлечение информации из / proc на регулярной основе, добавление временных меток и их запись таким образом, чтобы ее можно было импортировать в RDBMS, может быть очень полезным. Это может быть особенно полезно, если вы поместите всю информацию о производительности вашего сервера и процесса в одну СУБД, потому что тогда вы сможете сравнивать произвольные вещи, такие как производительность одного и того же приложения на разных серверах.

Имейте в виду, что если вы пойдете дальше с этим, вы начнете добавлять информацию из разных источников, таких как мониторинг хостов IPMI, так что не делайте того, что вам придется отменить, если вы используете больше, чем /proc.

0 голосов
/ 04 декабря 2009

В зависимости от того, какой низкий уровень вы хотите получить, Системный сигнал может быть очень полезным для вас. Это похоже на DTrace на Solaris.

0 голосов
/ 04 декабря 2009

Какие еще полезные метрики мне нужно измерить в инфраструктуре на основе SAN?

загрузка процессора. Это основные метрики для базы данных Oracle.

0 голосов
/ 04 декабря 2009

Я обычно использую поверх для контроля нагрузки на мои системы. Некоторые функции требуют, чтобы вы исправили ядро, но оно дает точную информацию о вводе / выводе, а также другую информацию.

0 голосов
/ 25 мая 2009

Вы можете использовать утилиты sysstat, которые представляют собой набор инструментов мониторинга производительности для Linux.

с сайта (perso.orange.fr/sebastien.godard/)

    * Can monitor a huge number of different metrics:

     1. Input / Output and transfer rate statistics (global, per device, per partition, per network filesystem and per Linux task / PID)
     2. CPU statistics (global, per CPU and per Linux task / PID), including support for virtualization architectures
     3. Memory and swap space utilization statistics
     4. Virtual memory, paging and fault statistics
     5. Per-task (per-PID) memory and page fault statistics
     6. Global CPU and page fault statistics for tasks and all their children
     7. Process creation activity
     8. Interrupt statistics (global, per CPU and per interrupt, including potential APIC interrupt sources)
     9. Extensive network statistics: network interface activity (number of packets and kB received and transmitted per second, etc.) including failures from network devices; network traffic statistics for IP, TCP, ICMP and UDP protocols based on SNMPv2 standards; support for IPv6-related protocols.
    10. NFS server and client activity
    11. Socket statistics
    12. Run queue and system load statistics
    13. Kernel internal tables utilization statistics
    14. System and per Linux task switching activity
    15. Swapping statistics
    16. TTY device activity
    17. Power management statistics
...