Получить входные данные задачи Mechanical Turk (например, URL-адрес изображения) из API Boto - PullRequest
0 голосов
/ 18 апреля 2020

При получении результатов из назначения Mechanical Turk с помощью API boto, как я могу увидеть входные данные из CSV, предоставленные до создания новой партии?

Единственный способ, которым я был найти его (кроме исходного файла CSV) можно из результатов пакетной обработки CSV, доступных из веб-панели MTurk.

Ни get_assignment(), ни get_hit() , кажется, включает эти данные.

1 Ответ

0 голосов
/ 22 апреля 2020

Мне удалось получить доступ к этой информации через API, хотя и несколько косвенно.

Следует отметить, что я работаю с задачей с ограничивающим прямоугольником, где для ввода требуется URL-адрес изображения на вопрос.

При вызове get_hit() ответ включает в себя поле Question, которое содержит макет вопроса XML, показанный работнику. Некоторые из входных данных, включая искомый URL-адрес изображения, доступны путем анализа этих XML данных.

Я использовал BeautifulSoup для анализа XML:

# Get the assignment
assignment = client.get_assignment(AssignmentId=assignment_id)
# Load the XML for the question, aka task
question_soup = BeautifulSoup(assignment['HIT']['Question'], 'lxml')
task_input = question_soup.find('crowd-bounding-box')
# Extract the image src
image_url = task_input['src']
...