Использование набора данных Google Natural Questions (NQ) - PullRequest
0 голосов
/ 25 марта 2020

Я хочу использовать Google Natural Questions (NQ) в качестве набора данных для чат-бота, который я создаю. Я скачал данные из Google Cloud с gsutil -m cp -R gs://natural_questions/v1.0 <path to your data directory>, но не могу понять, как использовать эти данные (я имею в виду разархивировать / загрузить в БД / загрузить в файл .csv). Данные представлены в виде .gstmp формата файла архива.

Файлы названы как nq-train-00.jsonl.gz_.gstmp, nq-train-01.jsonl.gz_.gstmp ... и т. Д.

Я не могу разархивировать этот файл, могу кто-нибудь поможет мне с этим? Спасибо!

Это ссылка на набор данных: https://ai.google.com/research/NaturalQuestions

1 Ответ

2 голосов
/ 26 марта 2020

Файлы .gstmp - это временные файлы, которые создаются, когда загрузка еще продолжается или еще не завершена для Google Cloud Platform Github Repository Release 4.14

...