У меня есть данные за 6 месяцев электронных писем (свойства электронной почты, такие как дата отправки, строка темы плюс сведения о получателе, такие как возраст, пол и т. Д., Всего около 20 столбцов) в моей таблице teradata.В общей сложности он составляет около 20 миллионов, и я хочу, чтобы его внедрили в Python для дальнейшего прогнозного моделирования.
Я пытался выполнить запрос выбора, используя соединитель 'pyodbc', но он просто работал часами.Затем я остановил его и изменил запрос, чтобы получить данные за 1 месяц (может быть 3-4 миллиона), но все еще занимает очень много времени.
Есть ли лучший (более быстрый) вариант, чем 'pyodbc' иликакой-то другой подход вообще?
Любой вклад приветствуется.спасибо