превышение количества URL при записи в файл Excel - PullRequest
2 голосов
/ 25 мая 2019

Я получил это предупреждение WARNING: C:\Users\diodi\AppData\Local\Programs\Python\Python37-32\lib\site-packages\xlsxwriter\worksheet.py:923: UserWarning: Ignoring URL 'https://www.google.com/search?q=hello+world' since it exceeds Excel's limit of 65,530 URLS per worksheet. "65,530 URLS per worksheet." % force_unicode(url))

Я использую для записи вывода очищенных данных

#spider.found_items is a list of dictionary
df = pd.DataFrame(spider.found_items)[ordered_list] #ordered_list is the order of dictiornary outputed
df.to_excel("{}.xlsx".format(file_name),sheet_name='All Products')

Я проверил это Количество URL-адресов превышает ограничение Excel в 65 530 URL-адресовна листе. , но это форматирует ссылки как строки (не кликабельно).Есть ли способ сохранить URL (как ссылку), если я могу написать на нескольких листах или любое другое предложение?

1 Ответ

1 голос
/ 26 мая 2019

По сути, это ограничение Excel.Это позволяет только 65 530 уникальных * URL-адресов на листе.Никакого обходного пути для этого не существует.

(*) Excel допускает более 65 530 неуникальных URL, если они сгруппированы непрерывно.Например, один и тот же URL в ячейках от A1 до A100 будет учитываться только как один URL-адрес против лимита 65 530.Тем не менее, группировка URL-адресов, чтобы воспользоваться этим, не поддерживается XlsxWriter (и даже если это так, это не поможет, если все URL-адреса являются уникальными или несмежными).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...