Я пытаюсь исключить разделители в текстовых квалификаторах. Для этого я пытаюсь использовать Regex. Тем не менее, я новичок в Regex и не могу полностью удовлетворить свои потребности. Я был бы очень признателен, если бы кто-нибудь мне помог.
В Alteryx я загружаю текстовый файл с разделителями как «без разделителей» и говорю, что у него нет текстовых квалификаторов. Таким образом, вход будет выглядеть примерно так:
- "AABB" | ccdd | Eeff | gghh
- "аа | бб" | ccdd | Eeff | gghh
- "аа | бб" | ccdd | "й | ФФ" | gghh
- "аа | бб" | "куб.см | дд" | "й | ФФ" | "GG | чч"
- "AABB" | "ccdd" | "Eeff" | "gghh"
- "AABB" | "ccdd" | "Eeff" | "GG | чч"
- ААББ | ccdd | Eeff | gghh
- "аа | бб" | ccdd | Eeff | "GG | чч"
- ААББ | куб.см | дд | Eeff | gghh
- ААББ | "куб.см || д" | Eeff | gghh
- ААББ | "с | с | д" | Eeff | gghh
- "аа || бб" | ccdd | Eeff | gghh
- "а | | б | б" | ccdd | Eeff | gghh
- "AABB" | ccdd | Eeff | "г | г | чч"
- "AABB" | ccdd | Eeff | "|| гг чч"
Я хочу исключить все разделители, которые находятся между квалификаторами текста.
Я пытался использовать Regex для замены разделителей в текстовых квалификаторах ничем.
До сих пор я пытался использовать следующий код Regex для своей цели:
(")(.*?[^"])\|+(.*?)(")
И я использовал следующее для моей замены:
$ 1 $ 2 $ 3 $ 4
Однако это не исправит строки 11, 13, 14 и 15.
Я хочу получить следующие результаты:
- "AABB" | ccdd | Eeff | gghh
- "AABB" | ccdd | Eeff | gghh
- "AABB" | ccdd | "Eeff" | gghh
- "AABB" | "ccdd" | "Eeff" | "gghh"
- "AABB" | "ccdd" | "Eeff" | "gghh"
- "AABB" | "ccdd" | "Eeff" | "gghh"
- ААББ | ccdd | Eeff | gghh
- "AABB" | ccdd | Eeff | "gghh"
- ААББ | куб.см | дд | Eeff | gghh
- ААББ | "ccdd" | Eeff | gghh
- ААББ | "ccdd" | Eeff | gghh
- "AABB" | ccdd | Eeff | gghh
- "AABB" | ccdd | Eeff | gghh
- "AABB" | ccdd | Eeff | "gghh"
- "AABB" | ccdd | Eeff | "gghh"
Заранее спасибо за помощь!
С уважением,
Robin