Разброс графиков в K-средние - PullRequest
2 голосов
/ 31 января 2020

У меня есть этот код, который делает следующее: Открывает файл CSV, который выглядит следующим образом, но только еще много строк

enter image description here

Это код

import pandas as pd
import os

df= pd.read_csv(r"C:/Users/z647818/Desktop/tree/tree.csv", delimiter=";", encoding='unicode_escape')
df['Numbers'] = df['Numbers'].str.split(',').str[0]
df['Numbers'] = df['Numbers'].astype('int64', copy=False)

def scatterGraph(str1):

    dfstr = df[df['Description'] == str1]
    dfstrval = df[df['Description'] == str1]['Numbers']
    print(dfstrval)
    dfstr.plot(kind='scatter', x='Numbers', y='Numbers')

str1 = 'Journey has started' # In order to search for any other string just put that string here.
scatterGraph(str1)

Что делает код? Он переходит к столбцу Description, фильтрует по имени строки Journey has started и отображает все значения столбца Numbers. Результат выглядит следующим образом.

enter image description here

Я ищу некоторую помощь в превращении той же структуры фильтрации по определенной строке из столбца, а затем в построение значений в K-средние

...