Один из столбцов в моей базе данных хранит текстовую информацию в указанном ниже формате. Текст не в стандартном формате, иногда перед полем «Дата страхования» может быть дополнительный текст. Когда я делю раздел в Python, он может поместить эту «дату страхования» в разные столбцы. Мне нужно найти значение «Дата страхования во всех столбцах в этом случае».
Образец текста
"Accumulation Period - period of time insured must incur eligible medical expenses at least equal to the deductible amount in order to establish a benefit period under a major medical expense or comprehensive medical expense policy.\n
Insurance Date 12/17/2018\n
Insurance Number 235845\n
Carrier Name SKGP\n
Coverage $240000"
Ожидаемый результат
INS_NO Insurance Date Carrier Name
235845 12/17/2018 SKGP
Как анализировать необработанные текстовую информацию, подобную этой, и извлечение значения даты страхования
Я использую приведенную ниже логику c, чтобы извлечь это, но я не знаю, как извлечь дату в другой столбец
df= pd.read_sql(query, conn)
df2=df["NOTES"].str.split("\n", expand=True)