DSpace 5.1 Solr количество элементов не синхронизировано - PullRequest
0 голосов
/ 05 декабря 2018

Я помогаю поддерживать установку DSpace 5.1.Наш клиент сообщил о давней проблеме, из-за которой количество всех элементов (в / статистика) не совпадает с суммой всех других типов элементов и со временем расходится.

Я предполагаю, что не всеоперации (например, удаление элемента?) корректно обновляют кэшированные значения, которые, похоже, исходят из ядра статистики Solr.

Я думаю, что мне нужно было бы запустить [dspace] / bin / dspace solr-reindex-statistics (статистика переиндексации SOLR, для обновлений или всякий раз, когда схема Solr для статистики изменяется) , но это приводит к ошибке использования в DSpace 5.1;кажется, что команда solr-reindex-statistics недоступна в DSpace 5.1

Учитывая, что мы, по-видимому, уже исправили этот тип проблем, я думаю, что это было бы исправлено, когда переиндексация как частьзначительное обновление.

Я думаю, что мне нужно выполнить следующую процедуру:

  1. stop tomcat
  2. backup [dspace] / solr / statistics
  3. запустить tomcat
  4. как tomcat, запустить [dspace] / bin / dspace stats-util -b -r
  5. когда закончите, перезапустить tomcat

Делает ли этокажется нормальным делом?Я только хочу обновить количество элементов на самом деле, я не хочу терять ничего, что не может быть восстановлено.

Глядя на мои предыдущие узлы обновления, когда мы переходили на 5.1 (который был либо с 5.0, либоиз 4.x я не уверен, с какой версии мы пришли), мы сделали следующее:

su - tomcat -s /bin/bash
  /usr/local/dspace/bin/dspace index-db-browse -f -d
  /usr/local/dspace/bin/dspace index-discovery -bf   ### perhaps an hour
  /usr/local/dspace/bin/dspace oai import -c -o
  /usr/local/dspace/bin/dspace oai clean-cache
  logout

В последующем обновлении, когда мы перешли на интерфейс Mirage2, мы также сделали *Процесс 1030 *, который занимал большую часть часа.

Не уверен, является ли это частью решения, но это похоже на тяжелый молот.

Я не разрабатываю иливести график обслуживания этого развертывания, я просто делаю развертывание и операции.К сожалению, на стороне разработчиков произошли некоторые кадровые изменения, поэтому в настоящее время обновление невозможно, и мы потеряли некоторые институциональные знания об этой платформе.

Большое спасибо, Кэмерон

1 Ответ

0 голосов
/ 05 декабря 2018

В DSpace 5 есть 2 механизма статистики.

Статистика на основе SOLR доступна по ссылкам с названием "Статистика использования".

Если SOLR работает правильно, эта статистика должна бытьсобраны.Задачи cron «stats-util» поддерживают сбор этих статистических данных, но они не должны требовать, чтобы вы видели сообщенные цифры.Запустите «stats-util -h» для получения информации об использовании каждого параметра.

Статистика Solr отображается на каждом уровне иерархии, если щелкнуть ссылки «Статистика использования».К сожалению, номера использования для сообщества или коллекции показывают посещения этого сообщества / коллекции.Они не показывают кумулятивное число для всех элементов в этой коллекции или сообществе.

"Старая статистика" извлекается из файлов журнала.Эти ссылки доступны в разделе / ​​статистика.Эта статистика генерируется с помощью задач «stat-month» и «stat-general».Я отключил эти отчеты в моем случае, потому что я не нашел надежные цифры.

См. https://wiki.duraspace.org/display/DSDOC7x/Command+Line+Operations#CommandLineOperations-Legacystatistics для получения дополнительной информации.Обратите внимание на рекомендацию использовать Solr Statistics.

Проверьте https://wiki.duraspace.org/display/DSPACE/Support, если вам нужна дополнительная поддержка.

...