В моем наборе данных все параметры имеют качественные переменные,
Когда, Все мои параметры (столбцы) отличаются для одной строки, тогда мы даем нам вес для этих переменных,
для колонного орошения мы даем нам 40% веса,
для почвы мы даем нам 35% веса и
для сорта семян мы даем нам 25% веса,
-
, поэтому, когда все параметры дают различное значение, тогда будет выбран выход для значения Irrigated column
на основе введенного нами веса (40%)
.
если повторяется более 2 раз, вывод будет отображаться как значение, повторенное 2 раза.
Любое предложение, это поможет.
>>> import pandas as pd
>>> data = {'District': ['Ahmednagar', 'Aurangabad','Jalna','Buldhana','Amravati','Nashik','Pune','Palghar'],
'Soil': ['B','A','D','D','A','B','D','A' ],
'Irrigated': ['B','B','D','A','A','B','C','A' ],
'Seed Variety': ['A','B','B','B','A','A','A','D']
}
>>> data
{'District': ['Ahmednagar', 'Aurangabad', 'Jalna', 'Buldhana', 'Amravati', 'Nashik', 'Pune', 'Palghar'], 'Soil': ['B', 'A', 'D', 'D', 'A', 'B', 'D', 'A'], 'Seed Variety': ['A', 'B', 'B', 'B', 'A', 'A', 'A', 'D'], 'Irrigated': ['B', 'B', 'D', 'A', 'A', 'B', 'C', 'A']}
>>> df = pd.DataFrame (data, columns = ['District','Soil','Irrigated','Seed Variety'])
>>> df
District ... Seed Variety
0 Ahmednagar ... A
1 Aurangabad ... B
2 Jalna ... B
3 Buldhana ... B
4 Amravati ... A
5 Nashik ... A
6 Pune ... A
7 Palghar ... D
[8 rows x 4 columns]
>>>