У меня есть фрейм данных для панд, содержащий 100 миллионов твитов.
Я извлек URL из данных и в настоящее время храню их в виде списка в столбце панд: Фрейм данных
Я хочу провести анализ этих URL-адресов (например, сортировку по доменному имени, выяснение, какой тип пользователя разместил и какие домены).
Можно ли хранить так: Пользовательский
где столбец URL представляет собой серию панд с динамическим размером, чтобы я мог легко обрабатывать?В противном случае, что было бы лучшим способом сохранить URL для эффективности при применении операций и скорости панд?