У меня есть этот фрейм данных в pandas:
df = pd.DataFrame(
{"bond": ["XSD070623A17","XSD090222A10","XSD100221A18", "XSD070623T15",
"XSD070623T23","XSD090222T32","XSD100221T11"],
"issue_date":["01.01.2020", "03.05.2020", "05.02.2020", "10.11.2019",
"01.01.2020", "03.05.2020", "12.10.2020"]
}
)
df
bond issue_date
0 XSD070623A17 01.01.2020
1 XSD090222A10 03.05.2020
2 XSD100221A18 05.02.2020
3 XSD070623T15 10.11.2019
4 XSD070623T23 01.01.2020
5 XSD090222T32 03.05.2020
6 XSD100221T11 12.10.2020
Как видите, первые 9 символов некоторых значений совпадают в столбце «связь». Я получу подмножество этого фрейма данных, которое для каждого значения, 10-й символ которого равен «A», я хочу получить значение, которое имеет то же самое, что и первые 9 символов, а 10-й символ равен «T». После этого, если дата выпуска облигаций «A» и «T» различается, я хочу отфильтровать обе эти облигации.
например, стоимость облигации 0-го индекса имеет тот же образец со значениями 3-го и 4-го индексов, но датой выпуска 0-й и 4-й индексы одинаковы, поэтому я хочу отфильтровать 0-ю и 3-ю строки. С другой стороны, стоимость облигации 1-го индекса совпадает с 5-м индексом, но даты их выпуска такие же, поэтому я не хочу фильтровать ни один из них.
В конце концов, я хочу получить следующий фрейм данных:
bond issue_date
0 XSD070623A17 01.01.2020
2 XSD100221A18 05.02.2020
3 XSD070623T15 10.11.2019
6 XSD100221T11 12.10.2020
Любая помощь будет принята с благодарностью.