Это очень широкий вопрос, но я надеюсь, что кто-нибудь может помочь мне с этой проблемой.
У меня есть один большой набор данных, и мне нужно сгенерировать несколько примеров из него. Сгенерированные данные должны содержать значения, которые могли бы появиться в исходном наборе данных (не случайные, а значения, которые все еще имеют некоторый смысл на основе исходного набора) . Например:
Original Data Set
Vendor | Category | Problem Category | Initial Detection Date | Action Date | Affected Devices | Engineer | Type of Analysis | Priority
M-Operations | Cybersecurity | Bad security policies | 09/11/2017 12:00AM | 09/11/2017 3:00AM | Third party devices | John O. | Hourly Analysis | P1
M-Operations | Cybersecurity | Penetration breach | 09/11/2017 12:00AM | 09/12/2017 3:00AM | Third party devices | Samuel P. | Daily Analysis | P2
Secure Total | CERT | Bad security policies | 09/13/2017 12:00AM | 09/13/2017 3:00AM | Main frames | Samuel P. | Hourly Analysis | P1
New Data Set
Vendor | Category | Problem Category | Initial Detection Date | Action Date | Affected Devices | Engineer | Type of Analysis | Priority
M-Operations | Cybersecurity | Penetration breach | 09/20/2017 12:00AM | 09/21/2017 3:00AM | Main frames | John P. | Hourly Analysis | P1
M-Operations | CERT | Bad security policies | 09/23/2017 12:00AM | 09/23/2017 3:00AM | Mobile devices | Samuel P. | Daily Analysis | P3
Secure Total | CERT | Bad security policies | 09/29/2017 12:00AM | 09/30/2017 3:00AM | Main frames | John P. | Hourly Analysis | P2
Я нашел следующую ссылку Создание данных с использованием существующего набора данных , который похож на мою проблему, но в этом случае все значения были числовыми, тогда как в моем примере некоторые из моих значений не числовые. Если бы кто-нибудь мог дать мне пример того, как сгенерировать этот новый набор данных в Python или R, был бы очень признателен за мое внутреннее спокойствие.