Основная проблема заключается в том, что код на самом деле не асинхронный.
После получения списка URL-адресов вы выбираете их по одному, а затем ожидаете ответа.
Лучше было бы отфильтровать дубликаты (используйте set
) перед установкой в очередь всех URL-адресов в исполнителе и ожидая их завершения, например:
async def get(self):
self.set_header("Access-Control-Allow-Origin", "*")
stories = []
loop = asyncio.get_event_loop()
# Single executor to share resources
executor = ThreadPoolExecutor()
# Get the initial set of ids
response = await loop.run_in_executor(executor, requests.get, 'https://hacker-news.firebaseio.com/v0/newstories.json?print=pretty')
response_data = response.json()
# Putting them in a set will remove duplicates
urls = set(response_data)
# Build the set of futures (returned by run_in_executor) and wait for them all to complete
responses = await asyncio.gather(*[
executor, requests.get,
) for url in urls
# Process the responses
for response in responses:
if response.status_code == 200 and len(response.text) > 5:
return stories