Процесс Кассандры убит ОС - PullRequest
0 голосов
/ 31 декабря 2018

Я использую сервер Apache Cassandra.После случайного промежутка времени мое обслуживание кассандры останавливается.когда я пытаюсь проверить его состояние с помощью 'service cassandra status' с помощью centOS7, он показывает мне следующий журнал

[centos@ip-172-31-24-101 routes]$ service cassandra status

cassandra.service - LSB: distributed storage system for structured data
   Loaded: loaded (/etc/rc.d/init.d/cassandra; bad; vendor preset: disabled)
   Active: failed (Result: exit-code) since Mon 2018-12-31 10:26:13 UTC; 34min ago
     Docs: man:systemd-sysv-generator(8)
Main PID: 2078 (code=killed, signal=KILL)

Dec 31 05:12:46 ip-172-31-24-101.ap-south-1.compute.internal su[781]: (to cassandra) root on none

Dec 31 05:12:49 ip-172-31-24-101.ap-south-1.compute.internal cassandra[761]: Starting Cassandra: OK

Dec 31 05:12:49 ip-172-31-24-101.ap-south-1.compute.internal systemd[1]: Started LSB: distributed storage system for structured data.

Dec 31 10:25:46 ip-172-31-24-101.ap-south-1.compute.internal systemd[1]: cassandra.service: main process exited, code=killed, s...KILL

Dec 31 10:25:47 ip-172-31-24-101.ap-south-1.compute.internal su[15760]: (to cassandra) root on none

Dec 31 10:25:47 ip-172-31-24-101.ap-south-1.compute.internal cassandra[15746]: Shutdown Cassandra: bash: line 0: kill: (2078) - ...ess

Dec 31 10:26:13 ip-172-31-24-101.ap-south-1.compute.internal cassandra[15746]: ERROR: could not stop cassandra

Dec 31 10:26:13 ip-172-31-24-101.ap-south-1.compute.internal systemd[1]: cassandra.service: control process exited, code=exited...us=1

Dec 31 10:26:13 ip-172-31-24-101.ap-south-1.compute.internal systemd[1]: Unit cassandra.service entered failed state.

Dec 31 10:26:13 ip-172-31-24-101.ap-south-1.compute.internal systemd[1]: cassandra.service failed."

Как я могу выяснить, что не так с Cassandra?почему его сбой?

Ответы [ 2 ]

0 голосов
/ 02 января 2019

Процесс, убиваемый SIGKILL, часто является результатом "OOM Killer" в Linux - который убивает процессы при нехватке памяти (см., Например, https://unix.stackexchange.com/questions/136291/will-linux-start-killing-my-processes-without-asking-me-if-memory-gets-short/136294 для получения дополнительной информации о OOM Killer).

Это может указывать на то, что вы отдаете слишком много памяти Кассандре (как для кучи, так и вне кучи), не хватает места для подкачки или того и другого.Если это убийца OOM, который убил вас, Кассандра, вы сможете найти сообщения журнала в обычных местах (dmesg, / var / log / messages, journalctl, в зависимости от вашего дистрибутива).Сообщения, которые выглядят примерно так:

[   54.125380] Out of memory: Kill process 8320 (cassandra) score 324 or sacrifice child
[   54.125382] Killed process 8320 (cassandra) total-vm:1309660kB, anon-rss:1287796kB, file-rss:76kB
0 голосов
/ 02 января 2019

Я бы посоветовал взглянуть на system.log для процесса Cassandra, так как он должен указать вам, где проблема.В зависимости от того, установлен ли C * из пакета или из архива, будет зависеть, где он находится.По умолчанию для установки пакета используется / var / log / cassandra, а для тарбола я думаю, что это каталог_установки / log / cassandra (в этом нет ничего хорошего).

...