Я удалил данные из Википедии и создал фрейм данных. df [0] содержит
\n \n == Sifat-sifat DNA == \n DNA merupakan sebuah polimer yang terdiri dari satuan-satuan berulang yang disebut nukleotida. Tiap-tiap nukleotida terdiri dari tiga komponen utama, yakni gugus fungsionalgugus fosfat, gula deoksiribosa, dan basa nitrogen (nukleobasa) < ref > {{en}}{{cite web \n url = http://www.ncbi.nlm.nih.gov/bookshelf/br.fcgi?book=mboc4 & part=A2 \n title = All Cells Replicate Their Hereditary Information by Templated Polymerization \n accessdate = 2010-03-19 \n work = Bruce Alberts, et al. \n }} < /ref > . Pada DNA, nukleobasa yang ditemukan adalah Adenina (A), Guanina (G), Sitosina (C) dan Timina (T).
Я хочу удалить:
< ref > {{en}}{{cite web \n url = http://www.ncbi.nlm.nih.gov/bookshelf/br.fcgi?book=mboc4 & part=A2 \n title = All Cells Replicate Their Hereditary Information by Templated Polymerization \n accessdate = 2010-03-19 \n work = Bruce Alberts, et al. \n }} < /ref >
Мне нужен способ сделать замену (или просто удалить) и текст между "" и "", чтобы при вызове df [0] теперь равнялся:
\n \n == Sifat-sifat DNA == \n DNA merupakan sebuah polimer yang terdiri dari satuan-satuan berulang yang disebut nukleotida. Tiap-tiap nukleotida terdiri dari tiga komponen utama, yakni gugus fungsionalgugus fosfat, gula deoksiribosa, dan basa nitrogen (nukleobasa). Pada DNA, nukleobasa yang ditemukan adalah Adenina (A), Guanina (G), Sitosina (C) dan Timina (T).
Я попытался:
df['Body'] = df['Body'].str.replace('< ref >.*?< /ref >','',regex=True)
df['Body'] = df['Body'].str.replace('< ref >.*< \/ref >','',regex=True)
, но вывод все еще не изменился вот так
\n \n == Sifat-sifat DNA == \n DNA merupakan sebuah polimer yang terdiri dari satuan-satuan berulang yang disebut nukleotida. Tiap-tiap nukleotida terdiri dari tiga komponen utama, yakni gugus fungsionalgugus fosfat, gula deoksiribosa, dan basa nitrogen (nukleobasa) < ref > {{en}}{{cite web \n url = http://www.ncbi.nlm.nih.gov/bookshelf/br.fcgi?book=mboc4 & part=A2 \n title = All Cells Replicate Their Hereditary Information by Templated Polymerization \n accessdate = 2010-03-19 \n work = Bruce Alberts, et al. \n }} < /ref > . Pada DNA, nukleobasa yang ditemukan adalah Adenina (A), Guanina (G), Sitosina (C) dan Timina (T).
В то время как мне нужно, как я объяснил ранее. Я не могу найти подстановочные знаки, которые, кажется, работают. Любая помощь очень ценится.