У меня есть файл 5 ГБ csv
, который занимает более часа для импорта в stata.
Причина, среди прочего, в европейском формате, то есть это ;
Разделенный файл и числовые столбцы поставляются с ,
в качестве десятичного разделителя.Например:
V1 V2 V3
A 2,4 10,1
B 30 1,4
Проблема в том, что stata
предполагает, что числовые столбцы являются строковыми переменными, поэтому пытается импортировать их действительно неэффективным способом (попытка объявить столбцы как числовые значения просто дает мне пропущенные значения).
Есть ли команда / опция, в которой я ввожу другой разделитель десятичных знаков, чтобы процесс импорта шел быстрее?