Как использовать один набор данных для моделирования другого, используя Python? - PullRequest
0 голосов
/ 11 июля 2020

У меня есть следующий пример df:

import pandas as pd

cars = {'Brand': ['Honda Civic','Toyota Corolla','Ford Focus','Audi A4'],
        'Price': [22000,25000,27000,35000]
        }

df = pd.DataFrame(cars, columns = ['Brand','Price'], index=['Car_1','Car_2','Car_3','Car_4'])

Есть ли способ создать новый набор данных с параметрами из первого? Я хочу, чтобы значения «Бренд» были одинаковыми, но значения «Цена» генерировались случайным образом с использованием минимального, максимального и среднего значений исходных значений в «Цена».

Я могу это закодировать вручную, но интересно, есть ли способ, чтобы python обнаруживал параметры фрейма данных и создавал новый с этими параметрами.

Примечание: пример фрейма данных, который я предоставил, крошечный, но эти концепции будут применяется к большим данным.

1 Ответ

0 голосов
/ 11 июля 2020

Вы можете использовать np.random.randint. Первые 2 параметра задают границы, а третий дает количество значений.

import pandas as pd
import numpy as np

df2 = pd.DataFrame({'Brand': df['Brand'],
                    'Price': np.random.randint(df['Price'].min(),
                                               df['Price'].max(), df.shape[0])})

print(df2)

       Brand            Price
Car_1  Honda Civic      29797
Car_2  Toyota Corolla   33306
Car_3  Ford Focus       26237
Car_4  Audi A4          23580
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...