Чтобы создать задания Spark, вы должны указать имя команды как «glueetl», как описано ниже, и если вы не запускаете задание оболочки python, вам не нужно указывать версию python в параметрах команды
response = client.create_job(
Name='mlxxxyu',
Role='Awsxxxx',
Command={
'Name': 'glueetl', # <—— mention the name as glueetl to create spark job
'ScriptLocation': 's3://aws-glue-scripts-xxxxx-us-west-2/xxxx'
},
Connections={
'Connections': [
'sxxxx',
'spxxxxxx',
]
},
Timeout=2880,
MaxCapacity=10
)
Что касается закладок задания, закладки задания по умолчанию отключены, поэтому, если вы не укажете параметр для закладок задания, то для созданного задания будут отключены закладки.
Если вы хотите явно отключитьзакладок, то вы можете указать то же самое в Аргументах по умолчанию [1], как показано ниже.
response = client.create_job(
Name='mlxxxyu',
Role='Awsxxxx',
Command={
'Name': 'glueetl',
'ScriptLocation': ‘s3://aws-glue-scripts-xxxxx-us-west-2/xxxx'
},
DefaultArguments={
'--job-bookmark-option': 'job-bookmark-disable'
},
Timeout=2880,
MaxCapacity=10
)