Не могу остановить логическую бомбу Узи - PullRequest
0 голосов
/ 17 декабря 2018

Я работаю над кластером Hadoop с Oozie в качестве менеджера задач.Один из моих товарищей по команде допустил ошибку и запустил следующий рабочий процесс oozie в кластере:

<?xml version="1.0" encoding="UTF-8"?>
<!-- A adapter ... -->
<workflow-app xmlns="uri:oozie:workflow:0.5" name="My-Workflow">
    <global>
        <job-tracker>${wf:conf('oozie.job.tracker')}</job-tracker>
        <name-node>${wf:conf('oozie.name.node')}</name-node>
        <configuration>
            <property>
                <name>oozie.launcher.mapred.job.queue.name</name>
                <value>${wf:conf('queueName')}</value>
            </property>
        </configuration>
    </global>

    <start to="compute-start"/>

    <fork name="compute-start">
        <path start="ci_mr-workflow"/>
        <path start="ci_mr_rem-workflow"/>
        <path start="ci_reg-workflow"/>
        <path start="ci_reg_read-workflow"/>
        <path start="ci_sp_geo-workflow"/>
        <path start="ci_sp_mtr_hist-workflow"/>
        <path start="cm_c_mr_bloc-workflow"/>
    </fork>


    <!-- Sub Workflows -->

    <action name="ci_mr-workflow">
        <sub-workflow>
            <app-path>${wf:conf('app.dir')}/oozie/ci_mr-workflow.xml</app-path>
            <propagate-configuration/>
        </sub-workflow>
        <ok to="compute-end"/>
        <error to="fail"/>
    </action>

    <action name="ci_mr_rem-workflow">
        <sub-workflow>
            <app-path>${wf:conf('app.dir')}/oozie/ci_mr_rem-workflow.xml</app-path>
            <propagate-configuration/>
        </sub-workflow>
        <ok to="compute-end"/>
        <error to="fail"/>
    </action>

    <action name="ci_reg-workflow">
        <sub-workflow>
            <app-path>${wf:conf('app.dir')}/oozie/ci_reg-workflow.xml</app-path>
            <propagate-configuration/>
        </sub-workflow>
        <ok to="compute-end"/>
        <error to="fail"/>
    </action>

    <action name="ci_reg_read-workflow">
        <sub-workflow>
            <app-path>${wf:conf('app.dir')}/oozie/ci_reg_read-workflow.xml</app-path>
            <propagate-configuration/>
        </sub-workflow>
        <ok to="compute-end"/>
        <error to="fail"/>
    </action>

    <action name="ci_sp_geo-workflow">
        <sub-workflow>
            <app-path>${wf:conf('app.dir')}/oozie/ci_sp_geo-workflow.xml</app-path>
            <propagate-configuration/>
        </sub-workflow>
        <ok to="compute-end"/>
        <error to="fail"/>
    </action>

    <action name="ci_sp_mtr_hist-workflow">
        <sub-workflow>
            <app-path>${wf:conf('app.dir')}/oozie/ci_sp_mtr_hist-workflow.xml</app-path>
            <propagate-configuration/>
        </sub-workflow>
        <ok to="compute-end"/>
        <error to="fail"/>
    </action>

    <action name="cm_c_mr_bloc-workflow">
        <sub-workflow>
            <app-path>${wf:conf('app.dir')}/oozie/cm_c_mr_bloc-workflow.xml</app-path>
            <propagate-configuration/>
        </sub-workflow>
        <ok to="compute-end"/>
        <error to="fail"/>
    </action>

    <join name="compute-end" to="end"/>


    <kill name="fail">
        <message>Job failed, error message: ${wf:errorMessage(wf:lastErrorNode())}</message>
    </kill>

    <end name="end"/>
</workflow-app>

И пример дополнительного рабочего процесса:

<?xml version="1.0" encoding="UTF-8"?>
<workflow-app xmlns="uri:oozie:workflow:0.5" name="My_Subworkflow">
    <global>
        <job-tracker>${wf:conf('oozie.job.tracker')}</job-tracker>
        <name-node>${wf:conf('oozie.name.node')}</name-node>
        <configuration>
            <property>
                <name>oozie.launcher.mapred.job.queue.name</name>
                <value>${wf:conf('queueName')}</value>
            </property>
        </configuration>
    </global>

    <start to="oracle-compute-ci_mr_rem"/>

    <action name="oracle-compute-ci_mr_rem">
        <sub-workflow>
            <app-path>${wf:conf('app.dir')}/oozie/_Oracle-workflow.xml</app-path>
            <propagate-configuration/>
            <configuration>
                <property>
                    <name>computeName</name>
                    <value>ci_mr_rem</value>
                </property>
                <property>
                    <name>computeTargetName</name>
                    <value>ci_mr_rem</value>
                </property>
                <property>
                    <name>computeFullPath</name>
                    <value>ci_mr_rem</value>
                </property>
                <property>
                    <name>computeType</name>
                    <value>Objects</value>
                </property>
                <property>
                    <name>computeSourceType</name>
                    <value>SourceType</value></value>
                </property>
                <property>
                    <name>computeSourceName</name>
                    <value>SourceName</value>
                </property>
            </configuration>
        </sub-workflow>
        <ok to="compute-end"/>
        <error to="fail"/>
    </action>

    <join name="compute-end" to="end"/>

    <kill name="fail">
        <message>Job failed, error message: ${wf:errorMessage(wf:lastErrorNode())}</message>
    </kill>

    <end name="end"/>
</workflow-app>

С тех пор этот рабочий процесс сталлогическая бомба, она реплицирует себя (и свои подпроцессы) бесконечно ... Я предполагаю, что действие "fork" дублирует родительский рабочий процесс в подпроцесс (как это сделал бы программный процесс).

Я быстро удалил рабочий процессфайлы и каталог и выполнили команду:

oozie jobs -kill -filter user=my_user

Но это не останавливает процесс, задания все еще живы и дублируются.

Нужна помощь, есть идеи?

1 Ответ

0 голосов
/ 17 декабря 2018

Перезагрузите кластер.Работа Oozie не будет возобновлена.

...