Какой поток Java загружает процессор? - PullRequest
54 голосов
/ 31 мая 2009

Допустим, ваша Java-программа использует 100% ЦП. Он имеет 50 потоков. Вам нужно найти, какая нить виновата. Я не нашел инструмент, который может помочь. В настоящее время я использую следующую очень трудоемкую процедуру:

  1. Выполнить jstack <pid>, где pid - это идентификатор процесса Java. Самый простой способ найти его - запустить другую утилиту, включенную в JDK - jps. Лучше перенаправить вывод jstack в файл.
  2. Поиск "запускаемых" тем. Пропустите те, которые ожидают сокета (по какой-то причине они все еще помечены как работающие).
  3. Повторите шаги 1 и 2 пару раз и посмотрите, сможете ли вы найти шаблон.

В качестве альтернативы, вы можете подключиться к процессу Java в Eclipse и попытаться приостановить потоки один за другим, пока не достигнете того, который загружает процессор. На машине с одним процессором вам может понадобиться сначала уменьшить приоритет процесса Java, чтобы иметь возможность перемещаться. Даже в этом случае Eclipse часто не может подключиться к запущенному процессу из-за тайм-аута.

Я бы ожидал, что visualvm инструмент Sun сделает это.

Кто-нибудь знает лучший способ?

Ответы [ 12 ]

73 голосов
/ 19 марта 2015

Определение того, какой поток Java потребляет больше всего ресурсов ЦП на рабочем сервере.

Большинство (если не все) продуктивные системы, которые делают что-то важное, будут использовать более 1 потока Java. И когда что-то сходит с ума, и загрузка вашего процессора составляет 100%, трудно определить, какие потоки (ы) это вызывают. Или я так думал. Пока кто-то умнее меня не показал мне, как это можно сделать. И здесь я покажу вам, как это сделать, и вы тоже сможете удивить свою семью и друзей своими навыками гика.

Тестовое приложение

Чтобы проверить это, нам нужно тестовое приложение. Так что я дам тебе один. Он состоит из 3 классов:

  • A HeavyThread класс, который делает что-то интенсивное использование процессора (вычисление хэшей MD5)
  • A LightThread класс, который делает что-то не слишком интенсивное для процессора (считать и спать).
  • A StartThreads класс для запуска с 1 процессором и несколькими легкими нитями.

Вот код для этих классов:

import java.security.MessageDigest;
import java.security.NoSuchAlgorithmException;
import java.util.UUID;

/**
 * thread that does some heavy lifting
 *
 * @author srasul
 *
 */
public class HeavyThread implements Runnable {

        private long length;

        public HeavyThread(long length) {
                this.length = length;
                new Thread(this).start();
        }

        @Override
        public void run() {
                while (true) {
                        String data = "";

                        // make some stuff up
                        for (int i = 0; i < length; i++) {
                                data += UUID.randomUUID().toString();
                        }

                        MessageDigest digest;
                        try {
                                digest = MessageDigest.getInstance("MD5");
                        } catch (NoSuchAlgorithmException e) {
                                throw new RuntimeException(e);
                        }

                        // hash the data
                        digest.update(data.getBytes());
                }
        }
}


import java.util.Random;

/**
 * thread that does little work. just count & sleep
 *
 * @author srasul
 *
 */
public class LightThread implements Runnable {

        public LightThread() {
                new Thread(this).start();
        }

        @Override
        public void run() {
                Long l = 0l;
                while(true) {
                        l++;
                        try {
                                Thread.sleep(new Random().nextInt(10));
                        } catch (InterruptedException e) {
                                e.printStackTrace();
                        }
                        if(l == Long.MAX_VALUE) {
                                l = 0l;
                        }
                }
        }
}


/**
 * start it all
 *
 * @author srasul
 *
 */
public class StartThreads {

        public static void main(String[] args) {
                // lets start 1 heavy ...
                new HeavyThread(1000);

                // ... and 3 light threads
                new LightThread();
                new LightThread();
                new LightThread();
        }
}

Предполагая, что вы никогда не видели этот код, и все, что у вас есть PID запущенного процесса Java, который выполняет эти классы и потребляет 100% ЦП.

Сначала давайте начнем StartThreads класс.

$ ls
HeavyThread.java  LightThread.java  StartThreads.java
$ javac *
$ java StartThreads &

На этом этапе запущенный Java-процесс должен занимать 100 процессоров. В моем топе я вижу: screenshot of top output

В верхней части нажмите Shift-H, которая включает нити. Страница руководства для top гласит:

   -H : Threads toggle
        Starts top with the last remembered 'H' state reversed.  When
        this  toggle is On, all individual threads will be displayed.
        Otherwise, top displays a  summation  of  all  threads  in  a
        process.

А теперь в моем топе с включенным дисплеем Тем я вижу: top screenshot with threads displayed

И у меня java процесс с PID 28294. Позволяет получить дамп стека этого процесса, используя jstack:

$ jstack 28924
2010-11-18 13:05:41
Full thread dump Java HotSpot(TM) 64-Bit Server VM (17.0-b16 mixed mode):

"Attach Listener" daemon prio=10 tid=0x0000000040ecb000 nid=0x7150 waiting on condition [0x0000000000000000]
   java.lang.Thread.State: RUNNABLE

"DestroyJavaVM" prio=10 tid=0x00007f9a98027800 nid=0x70fd waiting on condition [0x0000000000000000]
   java.lang.Thread.State: RUNNABLE

"Thread-3" prio=10 tid=0x00007f9a98025800 nid=0x710d waiting on condition [0x00007f9a9d543000]
   java.lang.Thread.State: TIMED_WAITING (sleeping)
    at java.lang.Thread.sleep(Native Method)
    at LightThread.run(LightThread.java:21)
    at java.lang.Thread.run(Thread.java:619)

"Thread-2" prio=10 tid=0x00007f9a98023800 nid=0x710c waiting on condition [0x00007f9a9d644000]
   java.lang.Thread.State: TIMED_WAITING (sleeping)
    at java.lang.Thread.sleep(Native Method)
    at LightThread.run(LightThread.java:21)
    at java.lang.Thread.run(Thread.java:619)

"Thread-1" prio=10 tid=0x00007f9a98021800 nid=0x710b waiting on condition [0x00007f9a9d745000]
   java.lang.Thread.State: TIMED_WAITING (sleeping)
    at java.lang.Thread.sleep(Native Method)
    at LightThread.run(LightThread.java:21)
    at java.lang.Thread.run(Thread.java:619)

"Thread-0" prio=10 tid=0x00007f9a98020000 nid=0x710a runnable [0x00007f9a9d846000]
   java.lang.Thread.State: RUNNABLE
    at sun.security.provider.DigestBase.engineReset(DigestBase.java:139)
    at sun.security.provider.DigestBase.engineUpdate(DigestBase.java:104)
    at java.security.MessageDigest$Delegate.engineUpdate(MessageDigest.java:538)
    at java.security.MessageDigest.update(MessageDigest.java:293)
    at sun.security.provider.SecureRandom.engineNextBytes(SecureRandom.java:197)
    - locked <0x00007f9aa457e400> (a sun.security.provider.SecureRandom)
    at sun.security.provider.NativePRNG$RandomIO.implNextBytes(NativePRNG.java:257)
    - locked <0x00007f9aa457e708> (a java.lang.Object)
    at sun.security.provider.NativePRNG$RandomIO.access$200(NativePRNG.java:108)
    at sun.security.provider.NativePRNG.engineNextBytes(NativePRNG.java:97)
    at java.security.SecureRandom.nextBytes(SecureRandom.java:433)
    - locked <0x00007f9aa4582fc8> (a java.security.SecureRandom)
    at java.util.UUID.randomUUID(UUID.java:162)
    at HeavyThread.run(HeavyThread.java:27)
    at java.lang.Thread.run(Thread.java:619)

"Low Memory Detector" daemon prio=10 tid=0x00007f9a98006800 nid=0x7108 runnable [0x0000000000000000]
   java.lang.Thread.State: RUNNABLE

"CompilerThread1" daemon prio=10 tid=0x00007f9a98004000 nid=0x7107 waiting on condition [0x0000000000000000]
   java.lang.Thread.State: RUNNABLE

"CompilerThread0" daemon prio=10 tid=0x00007f9a98001000 nid=0x7106 waiting on condition [0x0000000000000000]
   java.lang.Thread.State: RUNNABLE

"Signal Dispatcher" daemon prio=10 tid=0x0000000040de4000 nid=0x7105 runnable [0x0000000000000000]
   java.lang.Thread.State: RUNNABLE

"Finalizer" daemon prio=10 tid=0x0000000040dc4800 nid=0x7104 in Object.wait() [0x00007f9a97ffe000]
   java.lang.Thread.State: WAITING (on object monitor)
    at java.lang.Object.wait(Native Method)
    - waiting on <0x00007f9aa45506b0> (a java.lang.ref.ReferenceQueue$Lock)
    at java.lang.ref.ReferenceQueue.remove(ReferenceQueue.java:118)
    - locked <0x00007f9aa45506b0> (a java.lang.ref.ReferenceQueue$Lock)
    at java.lang.ref.ReferenceQueue.remove(ReferenceQueue.java:134)
    at java.lang.ref.Finalizer$FinalizerThread.run(Finalizer.java:159)

"Reference Handler" daemon prio=10 tid=0x0000000040dbd000 nid=0x7103 in Object.wait() [0x00007f9a9de92000]
   java.lang.Thread.State: WAITING (on object monitor)
    at java.lang.Object.wait(Native Method)
    - waiting on <0x00007f9aa4550318> (a java.lang.ref.Reference$Lock)
    at java.lang.Object.wait(Object.java:485)
    at java.lang.ref.Reference$ReferenceHandler.run(Reference.java:116)
    - locked <0x00007f9aa4550318> (a java.lang.ref.Reference$Lock)

"VM Thread" prio=10 tid=0x0000000040db8800 nid=0x7102 runnable 

"GC task thread#0 (ParallelGC)" prio=10 tid=0x0000000040d6e800 nid=0x70fe runnable 

"GC task thread#1 (ParallelGC)" prio=10 tid=0x0000000040d70800 nid=0x70ff runnable 

"GC task thread#2 (ParallelGC)" prio=10 tid=0x0000000040d72000 nid=0x7100 runnable 

"GC task thread#3 (ParallelGC)" prio=10 tid=0x0000000040d74000 nid=0x7101 runnable 

"VM Periodic Task Thread" prio=10 tid=0x00007f9a98011800 nid=0x7109 waiting on condition 

JNI global references: 910

С моей вершины я вижу, что PID верхней нити - 28938. И 28938 в шестнадцатеричном виде это 0x710A. Обратите внимание, что в дампе стека каждый поток имеет nid, который отображается в шестнадцатеричном виде. И так уж получилось, что 0x710A - это идентификатор потока:

"Thread-0" prio=10 tid=0x00007f9a98020000 nid=0x710a runnable [0x00007f9a9d846000]
   java.lang.Thread.State: RUNNABLE
    at sun.security.provider.DigestBase.engineReset(DigestBase.java:139)
    at sun.security.provider.DigestBase.engineUpdate(DigestBase.java:104)
    at java.security.MessageDigest$Delegate.engineUpdate(MessageDigest.java:538)
    at java.security.MessageDigest.update(MessageDigest.java:293)
    at sun.security.provider.SecureRandom.engineNextBytes(SecureRandom.java:197)
    - locked <0x00007f9aa457e400> (a sun.security.provider.SecureRandom)
    at sun.security.provider.NativePRNG$RandomIO.implNextBytes(NativePRNG.java:257)
    - locked <0x00007f9aa457e708> (a java.lang.Object)
    at sun.security.provider.NativePRNG$RandomIO.access$200(NativePRNG.java:108)
    at sun.security.provider.NativePRNG.engineNextBytes(NativePRNG.java:97)
    at java.security.SecureRandom.nextBytes(SecureRandom.java:433)
    - locked <0x00007f9aa4582fc8> (a java.security.SecureRandom)
    at java.util.UUID.randomUUID(UUID.java:162)
    at HeavyThread.run(HeavyThread.java:27)
    at java.lang.Thread.run(Thread.java:619)

И, таким образом, вы можете подтвердить, что поток, на котором работает класс HeavyThread, потребляет большую часть ЦП.

В ситуациях чтения мира, вероятно, это будет группа потоков, которые потребляют некоторую часть ЦП, и эти потоки, собранные вместе, приведут к процессу Java, использующему 100% ЦП.

Резюме

  • Run top
  • Нажмите Shift-H, чтобы включить просмотр потоков
  • Получить PID потока с самым высоким процессором
  • Конвертировать PID в HEX
  • Получить дамп стека процесса Java
  • Ищите нить с соответствующим шестнадцатеричным PID.
18 голосов
/ 26 марта 2013

jvmtop может показать вам самые популярные темы:

    TID NAME                                 STATE     CPU    TOTALCPU
     25 http-8080-Processor13                RUNNABLE  4.55%     1.60%
 128022 RMI TCP Connection(18)-10.101.       RUNNABLE  1.82%     0.02%
  36578 http-8080-Processor164               RUNNABLE  0.91%     2.35%
 128026 JMX server connection timeout   TIMED_WAITING  0.00%     0.00%
16 голосов
/ 31 мая 2009

Попробуйте поискать плагин Hot Thread Detector для визуальной виртуальной машины - он использует API-интерфейс ThreadMXBean для получения нескольких выборок загрузки ЦП для поиска наиболее активных потоков. Он основан на эквиваленте командной строки Брюса Чепмена , который также может быть полезен.

10 голосов
/ 31 мая 2009

Просто запустите JVisualVM, подключитесь к вашему приложению и используйте представление потоков. Тот, кто остается постоянно активным, является вашим наиболее вероятным виновником.

6 голосов
/ 01 июня 2009

Взгляните на плагин Top Threads для JConsole.

2 голосов
/ 31 мая 2009

Если вы работаете под Windows, попробуйте Process Explorer . Откройте диалоговое окно свойств для своего процесса и перейдите на вкладку «Потоки».

1 голос
/ 28 сентября 2018

Я бы порекомендовал взглянуть на Артас инструмент, открытый от Alibaba.

Он содержит кучу полезных команд, которые могут помочь вам отладить ваш рабочий код:

  • Панель инструментов : обзор процесса Java
  • SC : класс поиска, загруженный вашей JVM
  • Jad : декомпилировать класс в исходный код
  • Наблюдение : просмотр ввода вызова метода и результатов
  • Трассировка : найдите узкое место вашего вызова метода
  • Монитор : Просмотр статистики вызовов методов
  • Stack : просмотр стека вызовов метода
  • Tt : временной туннель вызовов методов

Пример приборной панели: dashboard

1 голос
/ 31 мая 2009

Вы используете Java 6 на многоядерном компьютере?

Скорее всего, вы страдаете от проблемы, которую я только что описал в статье о истощении потоков.

См. Синхронизация против блокировки против справедливой блокировки .

1 голос
/ 31 мая 2009

Возьми дамп нити. Подождите 10 секунд. Возьми еще одну ветку дампа. Повторите еще раз. Проверьте дампы потоков и посмотрите, какие потоки застряли в одном и том же месте или обрабатывают тот же запрос Это ручной способ, но часто полезный.

0 голосов
/ 31 мая 2009

Если вы подозреваете, что VisualVM - хороший инструмент, попробуйте его (потому что он это делает). Узнайте, что потоки только помогают вам понять, почему он потребляет так много ЦП.

Однако, если это так очевидно, я бы прямо обратился к профилировщику, чтобы выяснить, почему вы потребляете так много ЦП.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...