Вычисление значений из текстовых файлов в Python без расширения CSV - PullRequest
0 голосов
/ 03 декабря 2018

Я столкнулся с проблемами при попытке рассчитать среднюю зарплату и общую зарплату из следующего текстового файла.

#EMP_NO, EMP_NAME, AGE, POSITION, SALARY, YRS_EMP
 001, Peter Smyth, 26, Developer, 29000, 4
 002, Samuel Jones, 23, Developer, 24000, 1
 003, Laura Stewart, 41, DevOps, 42000, 15
 004, Paul Jones, 24, Analyst, 21000, 2
 005, Simon Brown, 52, Developer, 53000, 18
 006, George Staples, 42, Tester, 42000, 12
 007, Greg Throne, 57, DevOps, 50000, 23
 008, Aston Bently, 27, Tester, 33000, 5
 009, Ben Evans, 32, DevOps, 38000, 2
 010, Emma Samson, 23, DevOps, 22000, 1
 011, Stephanie Beggs, 43, Tester, 19000, 9
 012, Sarah McQuillin, 47, DevOps, 23000, 5
 013, Grace Corrigan, 48, Analyst, 44000, 16
 014, Simone Mills, 32, DevOps, 32000, 11
 015, Martin Montgomery, 28, Analyst, 28000, 3

Я даже не знаю, с чего начать

1 Ответ

0 голосов
/ 03 декабря 2018

Предположим, что файл, который вы там показали, называется myfile.txt (просто обязательно раскомментируйте первую строку).Тогда следующий код должен решить вашу проблему:

import pandas as pd

df = pd.read_csv(myfile_path, sep=',')

average_salaries = df["SALARY"].mean

print(average_salaries)

И так волшебство сделано.Если у вас не установлены панды, запустите pip install pandas в своем терминале.

Pandas - это библиотека python, созданная специально для анализа данных.Учитывая, что ваш файл в основном CSV, это, вероятно, лучший подход для правильного взаимодействия с ним.В случае, который я вам показал, я преобразовал ваш файл в фрейм данных с именем df, чтобы панды могли с ним справиться.

В этом конкретном случае мы используем функцию .mean длярассчитать среднее значение столбца SALARY, назвав его списком.(конечно, есть множество других функций).

...