Занимает ли загрузка файла Django процесс загрузки? - PullRequest
1 голос
/ 15 августа 2011

Я использую Django 1.3 за Apache через mod_wsgi (режим демона, 3 рабочих процесса).

Если пользователь загружает файл, занимает ли он полностью один из процессов в течение всей загрузки или может обрабатывать другие запросы, ожидая, пока куски данных не станут доступными? Если 3 пользователя загружают 3 файла, будут ли все новые запросы помещаться в очередь до завершения загрузки?


Редактировать : В настоящее время я использую рабочий mpm, 1 поток на процесс демона. Я готов изменить свою конфигурацию, если для этого есть веская причина.


Редактировать 2 : В идеале мне бы хотелось, чтобы apache обрабатывал загрузку и передавал ее в django, когда весь файл был загружен. Это так по умолчанию, и если нет, я изменяю конфигурацию, чтобы это произошло?

Ответы [ 2 ]

2 голосов
/ 16 августа 2011

Вы сказали:

В идеале я бы хотел, чтобы apache обрабатывал загрузку и передавал ее в django, когда весь файл был загружен.

Увы, HTTP на самом деле не работает таким образом. Проблема заключается в том, что тела запросов http могут быть файлами, или они могут быть очередями сообщений или каким-либо другим творческим использованием (возможно, пустым) потока октетов. Во-первых, это означает, что для сервера приложений будет неправильным решать, как обрабатывать тело запроса; Приложению может потребоваться прочитать часть запроса, и, если оно не пройдет проверку (скажем, неверные учетные данные для проверки подлинности или по любой другой причине), оно может закрыть соединение, прежде чем какая-либо полоса пропускания будет выделена для неверного запроса.

Это особенно актуально, когда запросы могут иметь произвольный, неограниченный размер (например, с использованием кодировки передачи по частям). Сервер приложений может элегантно абстрагировать тело запроса в простой файловый поток, но не может принять лучшего решения относительно его окончательной судьбы, чем этот.

По этой причине HTTP-серверы обычно вызывают приложение , как только все заголовки прочитаны , с телом запроса, готовым к потоковой передаче, если приложение желает.

С другой стороны, именно прикладные инфраструктуры работают для абстрагирования от общего использования, и django делает это, позволяя вам установить предпочтительный каталог загрузки и максимальный размер файла, а также некоторые другие параметры. Однако это все еще тесно связано с ограничениями, налагаемыми соображениями HTTP, как упомянуто выше. Обычно это работает достаточно хорошо, потому что большинство серверов обеспечивают достаточную пропускную способность и рабочие потоки для эффективного использования оборудования. Типичный рабочий пул (скажем, 5-50 одновременных потоков / процессов), все обслуживающие закачки файлов, вероятно, не оставляют на машине сервера какой-либо доступный ввод-вывод для обслуживания других запросов в любом случае.

Если ваше приложение не вписывается в эту модель, возможно, большинство запросов на самом деле связаны с процессором или обычно работают в оперативной памяти, но только несколько запросов выполняют дисковый ввод-вывод для загрузки файлов, тогда вам все равно придется выполнить некоторую пользовательскую настройку, Например, вам может потребоваться реорганизовать вашу службу в асинхронную среду, чтобы вы могли эффективно обрабатывать от тысячи до сотен тысяч одновременных, но медленных запросов или просто балансировать различные типы запросов на разных серверах приложений. Apache - хороший сервер приложений общего назначения, но он редко самый быстрый для конкретного приложения.

1 голос
/ 16 августа 2011

Поскольку вы используете однопоточный процесс демона mod_wsgi, то да, весь процесс демона будет занят в течение всего периода загрузки.Это связано с тем, что содержимое запроса передается прямо в приложение Django, и Apache не предварительно считывает содержимое запроса, прежде чем запрос будет передан mod_wsgi.

...