Question

Как правильно использовать кэш LRU в памяти в приложении scala, которое работает по искровому структурированному потоку, которое сохраняется в пакетах.

Я пытался использовать кеш Guava, но я думаю, что он не сериализуем, хотя я использую его как одноэлементный, новый кеш создается при каждой микропакете.

Чтобы обработать события, мне нужно просмотреть некоторые метаданные во внешнем источнике данных, и поэтому я хочу избегать обхода по сети для каждого вызова и вместо этого кэшировать их локально в течение определенного периода времени.

HellRaiser · Answer 1 · 18 апреля 2019

Вы можете попробовать написать собственную логику внутри mapGroupsWithState или flatMapGroupsWithState

Это хранилище с состоянием, которое может содержать вычисленные значения для поиска

Смотрите эту ссылку: https://databricks.com/blog/2017/10/17/arbitrary-stateful-processing-in-apache-sparks-structured-streaming.html

В кеш-памяти сохранялась между пакетами искровая структурированная потоковая

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

В кеш-памяти сохранялась между пакетами искровая структурированная потоковая

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы