Отказ от ответственности: я очень новичок в DA, как супер новый.
Я работаю над своим первым проектом с нуля. Это не такой большой набор данных, он немного более тысячи строк в Excel, но очень грязный. Они произвольно объединены из нескольких листов, но формат не унифицирован. Что заставляет меня задуматься о том, как проходит процесс подготовки данных перед работой в python. И является ли экономически более эффективным сначала просто выполнить ручную очистку в Excel или это можно сделать за Python с меньшими затратами времени?
Я имею в виду, конечно, это зависит от размера данных и от того, насколько квалифицирован аналитик является. Но я хотел знать, каковы обычные маршруты, используемые аналитиками при подготовке, учитывая эффективность и целостность данных.
Большое спасибо!