Я работаю над проблемой, в которой у меня есть очень большой набор данных в виде файла CSV. Этот CSV-файл имеет различные столбцы, одним из которых является код состояния. Набор данных значительно больше, чем мне нужно - мне просто нужны значения из одного состояния.
Решением, о котором я думал, было бы прочитать файл csv с помощью Python, а затем записать в новый файл только те строки, которые мне нужны, удалив 49 из 50 состояний (U.S).
CSV-файл содержит более 3 миллионов строк. Я новичок в Python, и я не уверен, как я могу эффективно это сделать, каковы наилучшие способы выполнения этой задачи?
Спасибо за вашу помощь, и я прошу прощения, если это кажется простым вопросом - я новичок в Python.