Я пытаюсь написать простой код python, который добавит дополнительный столбец. Этот столбец может быть корзиной или категорией уже существующих данных. Например, если один столбец - это средний доход, который является непрерывным. См., Например, таблицу ниже:
+---------------------------------+
| INDUSTRY | AVG Income |
+---------------------------------+
| Finance | 54,091 |
| Medical | 48,091 |
| Manufactoring | 43,545 |
| IT | 43,545 |
| Construction | 38,273 |
| Advertising | 22,020 |
+---------------------------------+
Я хочу создать третий столбец и go по строкам, заполняя категорию дохода. Пример: 0-25 000: низкий (доход), 25 000-40 000: средний (доход),> 40 000: высокий (доход).
Следовательно, CSV будет переписан как:
+-------------------------------------------------+
| INDUSTRY | AVG Income | Income Group |
+-------------------------------------------------+
| Finance | 54,091 | High |
| Medical | 48,091 | High |
| Manufactoring | 43,545 | High |
| IT | 43,545 | High |
| Construction | 38,273 | Med |
| Advertising | 22,020 | Low |
+-------------------------------------------------+
Я знаком с python и циклами for, проходящими «построчно», но не знаком с записью их в документ csv. Я могу понять, что мои операторы if будут выглядеть примерно так.
if AVG Income < 25000:
Income Group = Low
elif AVG Income >= 25 and AVG Income <40,000:
Income Group = Med
else:
Income Group = High
Это общий пример c, но концепцию, которую я бы использовал для категоризации различных столбцов непрерывных данных. ** Обратите внимание, что у моего csv на самом деле нет заголовков, поэтому мне не нужно использовать «следующий»