Граф Графана перестает обновляться - PullRequest
0 голосов
/ 08 апреля 2020
Apr  1 13:10:01 grid CRON[9839]: (root) CMD (/usr/sbin/icsisnap /var/lib/icsisnap)
Apr  1 13:12:00 grid telegraf[1172]: 2020-04-01T20:12:00Z E! [inputs.exec]: Error in plugin: exec: exit status 1 for command 'telegraf_slurm': bad scontrol output: JobId=68656789 JobName=cpt.simpoint_1_inst_71223295779_weight_0.048238_interval_1000000_warmup_1000000 2000000 UserId=ship(1236) GroupId=ship(1236) MCS_label=N/A Priority=500 Nice=0 Account=(null) QOS=normal WCKey=* JobState=RUNNING Reason=None Dependency=(null) Requeue=1 Restarts=0 BatchFlag=0 Reboot=0 ExitCode=0:0 RunTime=09:30:41 TimeLimit=10:00:00 TimeMin=N/A SubmitTime=2020-04-01T03:41:12 EligibleTime=2020-04-01T03:41:12 StartTime=2020-04-01T03:41:19 EndTime=2020-04-01T13:41:...
Apr  1 13:14:00 grid telegraf[1172]: 2020-04-01T20:14:00Z E! [inputs.exec]: Error in plugin: exec: exit status 1 for command 'telegraf_slurm': bad scontrol output: JobId=68656789 JobName=cpt.simpoint_1_inst_71223295779_weight_0.048238_interval_1000000_warmup_1000000 2000000 UserId=ship(1236) GroupId=ship(1236) MCS_label=N/A Priority=500 Nice=0 Account=(null) QOS=normal WCKey=* JobState=RUNNING Reason=None Dependency=(null) Requeue=1 Restarts=0 BatchFlag=0 Reboot=0 ExitCode=0:0 RunTime=09:32:41 TimeLimit=10:00:00 TimeMin=N/A SubmitTime=2020-04-01T03:41:12 EligibleTime=2020-04-01T03:41:12 StartTime=2020-04-01T03:41:19 EndTime=2020-04-01T13:41:...
Apr  1 13:28:00 grid telegraf[1172]: 2020-04-01T20:28:00Z E! [inputs.exec]: Error in plugin: exec: exit status 1 for command 'telegraf_slurm': bad scontrol output: JobId=68656789 JobName=cpt.simpoint_1_inst_71223295779_weight_0.048238_interval_1000000_warmup_1000000 2000000 UserId=ship(1236) GroupId=ship(1236) MCS_label=N/A Priority=500 Nice=0 Account=(null) QOS=normal WCKey=* JobState=RUNNING Reason=None Dependency=(null) Requeue=1 Restarts=0 BatchFlag=0 Reboot=0 ExitCode=0:0 RunTime=09:46:41 TimeLimit=10:00:00 TimeMin=N/A SubmitTime=2020-04-01T03:41:12 EligibleTime=2020-04-01T03:41:12 StartTime=2020-04-01T03:41:19 EndTime=2020-04-01T13:41:...

kkraj@grid:/var/log$ squeue | grep 68656789
          68656789  standard cpt.simp  ship  R    9:47:11      1 alpha20
kkraj@grid:/var/log$

График Grafana перестает обновляться часто из-за указанного выше E! [inputs.exec]: Error in plugin error журнала, когда есть плохая работа [здесь, 68656789]. После его уничтожения график работает нормально.

Есть ли какой-либо параметр в conf-файлах телеграфа, который вызывает эту проблему. Я хочу, даже если есть плохие выходные данные, график не должен перестать обновляться. Спасибо

Спасибо

$cat input-exec-slurm.conf
[[inputs.exec]]
commands =["telegraf_slurm"]
interval = "120s"
data_format = "influx"
...