Я бы действительно рекомендовал придерживаться кода, выпущенного Couchbase для Python. Хотя это технически не асинхронно, запросы настолько быстры, что на самом деле не влияют на вещи. Это не то же самое, что создание запроса к базе данных, которая может легко заблокировать продолжающиеся действия на определенный период времени. Не говоря уже о том, что существует много кода для балансировки нагрузки и управления корзинами, который вы потеряли бы в большинстве ситуаций, пытаясь найти для него какой-либо сторонний модуль.
Кроме того, вы всегда можете создать многопроцессорный пакет для создания подпроцессов, которые будут обрабатывать удаление этих вызовов из основного потока процесса и сводить влияние практически к нулю.
UPDATE
Другой вариант - использовать функцию внутреннего обратного вызова Tornado, чтобы компенсировать процесс блокировки, чтобы он не ухудшал просмотр. Метод для этого описан здесь: http://tornadogists.org/2185380/