У меня есть фрейм данных со столбцом, известным как «msg».
В столбце «msg» все строки выглядят примерно так, как показано ниже. Пользователь xxxx имеет длину 6 или 7 символов. xx.xx.xx.xx и yy.yy.yy.yy являются IP-адресами, поэтому каждый октет может быть 1 ди git или 3 цифрами.
User xxxxxx is attempting to restart primary host xxx.xx.xxx.xx (id=1) for managed host yyy.yy.yyy.yy (id=4) at Dec 30, 2019, 6:08:87 PM
Мне нужно правило для извлечения всего в каждом ячейка перед "в De c 30, 2019, 6:08:87 вечера"? т.е. я хочу отбросить все символы после "at \ w \ w \ w \ d \ d, \ d \ d \ d \ d, \ d: \ d \ d: \ d \ d ....."
Мой текущий код, как показано ниже, но я не уверен, как заполнить пат.
Test = df['msg'].str.extract(pat='...')
Ответьте на комментарии ниже: Мэтью: да. Формат после 2-го (id = xx) одинаков. Джон: в любом случае это нормально.