Долгоживущий Java WeakReferences - PullRequest
       35

Долгоживущий Java WeakReferences

20 голосов
/ 06 октября 2010

В настоящее время я пытаюсь диагностировать медленную утечку памяти в моем приложении. На данный момент у меня есть следующие факты.

  • У меня есть дамп кучи из 4-дневного прогона приложения.
  • Этот дамп кучи содержит ~ 800 объектов WeakReference, которые указывают на объекты (все того же типа, которые я буду называть Foo для целей этого вопроса), сохраняющие 40 МБ памяти.
  • Eclipse Memory Analysis Tool показывает, что каждый из объектов Foo, на которые ссылаются эти WeakReferences, не упоминается никакими другими объектами. Я ожидаю, что это должно сделать эти объекты Foo слабо доступными и, таким образом, они должны быть собраны на следующем GC.
  • Каждый из этих объектов Foo имеет временную метку, которая показывает, что они были распределены в течение 4-дневного прогона. У меня также есть журналы, которые подтверждают, что сборка мусора происходила.
  • Мое приложение создает огромное количество объектов Foo, и только очень малая их часть попадает в это состояние в дампе кучи. Это говорит мне о том, что коренной причиной является какое-то состояние расы.
  • Мое приложение использует JNI для вызова нативной библиотеки. Код JNI вызывает NewGlobalRef 4 раза в начале инициализации дня, чтобы получить ссылки на используемые им классы Java.

Что может привести к тому, что эти классы Foo не будут собираться, несмотря на то, что на них ссылается только WeakReferences (согласно Eclipse Memory Analyzer Tool)?

EDIT1:

@ Миндаш Слабая ссылка, которую я использую, эквивалентна следующему примеру кода.

public class FooWeakRef extends WeakReference<Foo>
{
  public long longA;
  public long longB;
  public String stringA;

  public FooWeakRef(Foo xiObject, ReferenceQueue<Foo> xiQueue)
  {
    super(xiObject, xiQueue);
  }
}

Foo не имеет финализатора, и любой финализатор не будет рассматриваться, пока WeakRefs не были очищены. Объект не может быть завершен, когда он слабо достижим. Подробности смотрите на этой странице .

@ kasten Слабые ссылки очищаются до завершения объекта. Мой дамп кучи показывает, что этого не произошло.

@ jarnbjo Я ссылаюсь на Javadoc WeakReference:

"Предположим, что сборщик мусора определяет в определенный момент времени, что объект является слабо достижимым. В это время он будет атомарно очищать все слабые ссылки на этот объект и все слабые ссылки на любые другие слабодоступные объекты, из которых это объект доступен через цепочку сильных и мягких ссылок. "

Это наводит меня на мысль, что сборщик мусора должен обнаружить тот факт, что мои объекты Foo «слабо достижимы» и «в это время» очищают слабые ссылки.

РЕДАКТИРОВАТЬ 2

@ j flemm - я знаю, что 40 МБ звучит не так много, но я беспокоюсь, что 40 МБ за 4 дня означает 4000 МБ за 100 дней. Все документы, которые я прочитал, предполагают, что объекты, которые плохо доступны, не должны торчать в течение нескольких дней. Поэтому меня интересуют любые другие объяснения того, как можно строго ссылаться на объект без ссылки, отображаемой в дампе кучи.

Я собираюсь попытаться выделить несколько больших объектов, когда присутствуют некоторые из этих висящих объектов Foo, и посмотреть, собирает ли их JVM. Однако этот тест займет несколько дней для настройки и завершения.

РЕДАКТИРОВАТЬ 3

@ jarnbjo - Я понимаю, что у меня нет гарантии, когда JDK заметит, что объект слабо доступен. Однако я ожидаю, что приложение под большой нагрузкой в ​​течение 4 дней предоставит GC достаточно возможностей, чтобы заметить, что мои объекты слабо доступны. Через 4 дня я сильно подозреваю, что оставшиеся слабо ссылочные объекты как-то просочились.

РЕДАКТИРОВАТЬ 4

@ j flemm - Это действительно интересно!Просто чтобы уточнить, вы говорите, что GC происходит в вашем приложении и не очищает Soft / Weak refs?Не могли бы вы дать мне более подробную информацию о том, какую конфигурацию JVM + GC вы используете?Мое приложение использует панель памяти в 80% кучи для запуска GC.Я предполагал, что любой GC старого поколения очистит слабых рефери.Вы предлагаете, чтобы ГХ собирал Слабые ссылки только после того, как использование памяти превысило более высокий порог?Настраивается ли этот верхний предел?

РЕДАКТИРОВАТЬ 5

@ j flemm - Ваш комментарий об очистке WeakRefs до SoftRefs соответствует Javadoc, который гласит: SoftRef: «Предположим, что сборщик мусора определяет вопределенный момент времени, когда объект является мягко достижимым. В это время может выбрать атомарную очистку всех мягких ссылок на этот объект и всех мягких ссылок на любые другие мягко достижимые объекты, из которых этот объект достижимчерез цепочку сильных ссылок. В то же время или в более позднее время он ставит в очередь те недавно очищенные мягкие ссылки, которые зарегистрированы в очередях ссылок. "

WeakRef:" Предположим, что сборщик мусора определяет вопределенный момент времени, когда объект слабо достижим. В это время он будет атомно очищать все слабые ссылки на этот объект и все слабые ссылки на любые другие слабо достижимые объекты, из которых этот объект доступен через цепочкуиз стройнг и мягкие ссылки.В то же время он объявит, что все ранее слабо достижимые объекты были завершены.В то же время или в более позднее время он будет ставить в очередь те недавно очищенные слабые ссылки, которые зарегистрированы в очередях ссылок. "

Для ясности вы говорите, что сборщик мусора запускается, когда в вашем приложении более 50% свободной памяти, и в этом случае он не очищает WeakRefs. Зачем вообще запускать сборщик мусора, когда в вашем приложении> 50% свободной памяти? Я думаю, что ваше приложение, вероятно, просто генерирует очень небольшое количество мусора и когда его выполняет сборщикочищает WeakRefs, но не SoftRefs.

EDIT 6

@ j flemm - Другое возможное объяснение поведения вашего приложения состоит в том, что молодой ген собирается, но все ваши слабые и мягкие реферив старом гене и очищаются только при сборе старого. Для моего приложения у меня есть статистика, показывающая, что старый ген собирается, что должно означать, что WeakRefs очищены.

РЕДАКТИРОВАТЬ 7

Я начинаю вознаграждение по этому вопросу. Я ищу любые правдоподобные объяснения того, как WeakRefs может не удаляться, пока происходит GC.Если ответ заключается в том, что это невозможно, в идеале я хотел бы указать на соответствующие биты OpenJDK, которые показывают, что WeakRefs очищаются, как только определено, что объект является слабо достижимым, и что слабая достижимость разрешается при каждом запуске GC.

Ответы [ 7 ]

3 голосов
/ 04 ноября 2011

Наконец-то я добрался до проверки исходного кода Jotsp-доступа Hotspot и нашел следующий код:

В файле referenceProcessor.cpp:

void ReferenceProcessor::process_discovered_references(
  BoolObjectClosure*           is_alive,
  OopClosure*                  keep_alive,
  VoidClosure*                 complete_gc,
  AbstractRefProcTaskExecutor* task_executor) {
  NOT_PRODUCT(verify_ok_to_handle_reflists());

  assert(!enqueuing_is_done(), "If here enqueuing should not be complete");
  // Stop treating discovered references specially.
  disable_discovery();

  bool trace_time = PrintGCDetails && PrintReferenceGC;
  // Soft references
  {
    TraceTime tt("SoftReference", trace_time, false, gclog_or_tty);
    process_discovered_reflist(_discoveredSoftRefs, _current_soft_ref_policy, true,
                               is_alive, keep_alive, complete_gc, task_executor);
  }

  update_soft_ref_master_clock();

  // Weak references
  {
    TraceTime tt("WeakReference", trace_time, false, gclog_or_tty);
    process_discovered_reflist(_discoveredWeakRefs, NULL, true,
                               is_alive, keep_alive, complete_gc, task_executor);
  }

Функция process_discovered_reflist имеет следующую подпись:

void
ReferenceProcessor::process_discovered_reflist(
  DiscoveredList               refs_lists[],
  ReferencePolicy*             policy,
  bool                         clear_referent,
  BoolObjectClosure*           is_alive,
  OopClosure*                  keep_alive,
  VoidClosure*                 complete_gc,
  AbstractRefProcTaskExecutor* task_executor)

Это показывает, что WeakRefs безоговорочно очищаются ReferenceProcessor :: process_discovered_references.

Поиск кода Hotspot для process_discovered_reference показывает, что коллектор CMS (который я использую) вызывает этот методиз следующего стека вызовов.

CMSCollector::refProcessingWork
CMSCollector::checkpointRootsFinalWork
CMSCollector::checkpointRootsFinal

Этот стек вызовов выглядит так, как будто он вызывается каждый раз при запуске коллекции CMS.

Предполагая, что это правда, единственное объяснение долгоживущего слабоссылка на объект будет либо незначительной ошибкой JVM, либо если GC не был запущен.

1 голос
/ 13 октября 2010

Возможно, вы захотите проверить, не возникла ли у вас проблема с загрузчиком классов. Больше на эту тему вы можете найти в этом блоге

0 голосов
/ 15 октября 2010

Для неверующих, которые утверждают, что слабые ссылки очищаются перед мягкими ссылками:

import java.lang.ref.Reference;
import java.lang.ref.ReferenceQueue;
import java.lang.ref.SoftReference;
import java.lang.ref.WeakReference;
import java.util.HashMap;
import java.util.Map;


public class Test {

/**
 * @param args
 */
public static void main(String[] args) {
    ReferenceQueue<Object> q = new ReferenceQueue<Object>();
    Map<Reference<?>, String> referenceToId = new HashMap<Reference<?>, String>();
    for(int i=0; i<100; ++i) {
        Object obj = new byte [10*1024*1024];    // 10M
        SoftReference<Object> sr = new SoftReference<Object>(obj, q);
        referenceToId.put(sr, "soft:"+i);
        WeakReference<Object> wr = new WeakReference<Object>(obj, q);
        referenceToId.put(wr, "weak:"+i);

        for(;;){
            Reference<?> ref = q.poll();
            if(ref == null) {
                break;
            }
            System.out.println("cleared reference " + referenceToId.get(ref) + ", value=" + ref.get());
        }
    }
}
}

Если вы запустите его с -client или -server, вы увидите, что мягкие ссылки всегда очищаются перед слабыми ссылками, что также согласуется с Javadoc: http://download.oracle.com/javase/1.4.2/docs/api/java/lang/ref/package-summary.html#reachability

Обычно мягкие / слабые ссылки используются в связи с Картами для создания типов кэшей. Если ключи в вашей карте сравниваются с оператором == (или не переопределяются .equals из объекта), то лучше использовать карту, которая работает с ключами SoftReference (например, из Apache Commons) - когда объект «исчезает», никакой другой объект никогда не будет быть равным в смысле «==» старому. Если ключи вашей карты сравниваются с расширенным оператором .equals (), таким как String или Date, многие другие объекты могут совпадать с «исчезающими», поэтому лучше использовать стандартный WeakHashMap.

0 голосов
/ 15 октября 2010

Я не знаком с Java, но вы можете использовать поколенческий сборщик мусора , который будет хранить только ваши объекты Foo и FooWeakRef (не собранные), пока

  • они прошли в старшем поколении
  • достаточно памяти для выделения новых объектов в младших поколениях

Различает ли журнал, указывающий, что произошла сборка мусора, основные и второстепенные коллекции?

0 голосов
/ 12 октября 2010

@ iirekm No: WeakReferences «слабее», чем SoftReferences, что означает, что WeakReference всегда будет собираться мусором до SoftReference.

Подробнее в этом посте: Понимание справочных классов Java: SoftReference, WeakReference и PhantomReference

Редактировать: (после прочтения комментариев) Да, конечно, слабые ссылки «слабее», чем SoftReferences, опечатка. : S

Вот несколько вариантов использования, чтобы пролить дополнительный свет на объект:

  • SoftReference : кэш в памяти (объект остается в живых, пока виртуальная машина не сочтет, что памяти недостаточно)
  • WeakReference : автоматическая очистка прослушивателей (объект должен быть очищен в следующем цикле GC после того, как считается, что он слабо доступен)
  • PhantomReference : предотвращение ошибок нехватки памяти при обработке необычно больших объектов (когда мы запланировали в очереди ссылок, мы знаем, что хост-объект должен быть очищен , безопасно выделять другой большой объект). Думайте об этом как об альтернативе finalize (), без возможности вернуть мертвые объекты к жизни (как вы могли бы потенциально с finalize)

При этом, ничто не мешает ВМ (пожалуйста, исправьте меня, если я ошибаюсь), чтобы Слабо достижимые объекты оставались в живых до тех пор, пока они не исчерпывают память (как в случае оригинального автора). 1029 *

Это лучший ресурс, который я смог найти по теме: http://www.pawlan.com/monica/articles/refobjs/

Редактировать 2: добавлено «быть» перед очищенным в PhantomRef

0 голосов
/ 11 октября 2010

Попробуйте вместо SoftReference.В Javadoc говорится: все мягкие ссылки на объекты с мягким доступом гарантированно будут очищены до того, как виртуальная машина сгенерирует OutOfMemoryError.

WeakReference не имеет таких гарантий, что делает их более подходящими для кэшей, но иногда SoftReferencesлучше.

0 голосов
/ 06 октября 2010

Вам необходимо уточнить, какая связь существует между Foo и WeakReference.Случай

class Wrapper<T> extends WeakReference<T> {
  private final T referent;
  public Wrapper(T referent) {
    super(t);
    this.referent = referent;
  }
}

очень отличается от просто

class Wrapper<T> extends WeakReferece<T> {
  public Wrapper(T referent) {
    super(t);
  }
}

или его встроенной версии WeakReference<Foo> wr = new WeakReference<Foo>(foo).

Так что я предполагаю, что ваш случай не такой, как я описалв моем первом фрагменте кода.

Как вы уже сказали, что работаете с JNI, вы можете проверить, есть ли у вас небезопасные финализаторы.У каждого финализатора должен быть блок finally, вызывающий super.finalize(), и его легко проскользнуть.

Возможно, вам нужно больше рассказать нам о природе ваших объектов, чтобы предложить лучшие идеи.

...