Я хочу использовать Google Natural Questions (NQ) в качестве набора данных для чат-бота, который я создаю. Я скачал данные из Google Cloud с gsutil -m cp -R gs://natural_questions/v1.0 <path to your data directory>
, но не могу понять, как использовать эти данные (я имею в виду разархивировать / загрузить в БД / загрузить в файл .csv). Данные представлены в виде .gstmp
формата файла архива.
Файлы названы как nq-train-00.jsonl.gz_.gstmp, nq-train-01.jsonl.gz_.gstmp ...
и т. Д.
Я не могу разархивировать этот файл, могу кто-нибудь поможет мне с этим? Спасибо!
Это ссылка на набор данных: https://ai.google.com/research/NaturalQuestions