Получите SIGTERM при запуске logstash версии 7.1.1 - PullRequest
0 голосов
/ 14 июня 2019

Я пытаюсь использовать logstash для отправки данных с kafka на s3 через logstash, и я получаю SIGTERM в процессе logstash без видимых сообщений об ошибках.

Я использую следующее переопределение шаблона helm.файл yaml.

# overrides stable/logstash helm templates
inputs:
  main: |-
    input {
      kafka{
        bootstrap_servers =>  "kafka.system.svc.cluster.local:9092"
        group_id => "kafka-s3"
        topics => "device,message"
        consumer_threads => 3
        codec => json { charset => "UTF-8" }
        decorate_events => true
      }
    }

# time_file default = 15 minutes
# size_file default = 5242880 bytes
outputs:
  main: |-
    output {
      s3 {
        codec => "json"
        prefix => "kafka/%{+YYYY}/%{+MM}/%{+dd}/%{+HH}-%{+mm}"
        time_file => 5
        size_file => 5242880
        region => "ap-northeast-1"
        bucket => "logging"
        canned_acl => "private"
      }
    }

podAnnotations: {
  iam.amazonaws.com/role: kafka-s3-rules
  }

image:
  tag: 7.1.1

моя роль AWS IAM должна быть прикреплена к контейнеру через iam2kube.Сама роль разрешает все действия на S3.

Моя корзина S3 имеет следующую политику:

{
    "Version": "2012-10-17",
    "Id": "LoggingBucketPolicy",
    "Statement": [
        {
            "Sid": "Stmt1554291237763",
            "Effect": "Allow",
            "Principal": {
                "AWS": "636082426924"
            },
            "Action": "s3:*",
            "Resource": "arn:aws:s3:::logging/*"
        }
    ]
}

Журналы для контейнера:

2019/06/13 10:31:15 Setting 'path.config' from environment.
2019/06/13 10:31:15 Setting 'queue.max_bytes' from environment.
2019/06/13 10:31:15 Setting 'queue.drain' from environment.
2019/06/13 10:31:15 Setting 'http.port' from environment.
2019/06/13 10:31:15 Setting 'http.host' from environment.
2019/06/13 10:31:15 Setting 'path.data' from environment.
2019/06/13 10:31:15 Setting 'queue.checkpoint.writes' from environment.
2019/06/13 10:31:15 Setting 'queue.type' from environment.
2019/06/13 10:31:15 Setting 'config.reload.automatic' from environment.
OpenJDK 64-Bit Server VM warning: If the number of processors is expected to increase from one, then you should configure the number of parallel GC threads appropriately using -XX:ParallelGCThreads=N
Sending Logstash logs to /usr/share/logstash/logs which is now configured via log4j2.properties
[2019-06-13T10:31:38,061][WARN ][logstash.config.source.multilocal] Ignoring the 'pipelines.yml' file because modules or command line options are specified
[2019-06-13T10:31:38,078][INFO ][logstash.runner          ] Starting Logstash {"logstash.version"=>"7.1.1"}
[2019-06-13T10:32:02,882][WARN ][logstash.runner          ] SIGTERM received. Shutting down.

Есть ли способ получить более подробные журналы, или кто-нибудь знает, с чем я имею дело?Я очень ценю любую помощь или совет!: No_mouth:

1 Ответ

0 голосов
/ 27 июня 2019

Проблема:

Глядя на детали модуля для logstash, я смог определить проблему .. У меня есть запись, подобная следующей.

I0414 19:41:24.402257    3338 prober.go:104] Liveness probe for "mypod:mycontainer" failed (failure): Get http://10.168.0.3:80/: dial tcp 10.168.0.3:80: connection refused

Указано "соединение"отказано" для датчика живучести, и после 50 ~ 60 секунд безотказной работы перезапустил модуль.

Причина:

Если посмотреть на датчик живучести на рулевом столе Values.yaml, он показывает следующие настройки.

...

livenessProbe:
  httpGet:
    path: /
    port: monitor
initialDelaySeconds: 20
# periodSeconds: 30
# timeoutSeconds: 30
# failureThreshold: 6
# successThreshold: 1

...

Устанавливается только InitialDelaySeconds, поэтому остальные значения должны быть по умолчанию Kubernetes, как показано здесь до следующего.

# periodSeconds: 10
# timeoutSeconds: 1
# failureThreshold: 1
# successThreshold: 3

Это означает, что следующие операции дадут или займут несколько секунд:

+------+-----------------------------+
| Time |            Event            |
+------+-----------------------------+
| 0s   | Container created           |
| 20s  | First liveness probe        |
| 21s  | First liveness probe fails  |
| 31s  | Second liveness probe       |
| 32s  | Second liveness probe fails |
| 42s  | Third liveness probe        |
| 43s  | Third liveness probe fails  |
| 44s  | Send SIGTERM to application |
+------+-----------------------------+

Решение:

После некоторого устранения неполадок, чтобы найти правильное значение InitialDelaySeconds, я вставил следующее в мой override.yamlфайл для решения проблемы.

livenessProbe:
  initialDelaySeconds: 90

Похоже, что в зависимости от используемых плагинов Logstash может не отвечать на запросы HTTP свыше 100 с.

...