Я пытаюсь отключить данные COVID-19 в Knime с помощью узла отмены. Данные, доступные от Джона Хопкинса в https://github.com/CSSEGISandData/COVID-19, представляют собой широкоформатный формат, в котором каждый новый день данных добавляется в виде нового столбца.
Я могу вручную сделать столбцы с ежедневными данными будут строки с узлом Unpivoting . Однако каждый день я должен перенастраивать узел для учета нового столбца. В моем рабочем процессе есть 5 узлов, которые должны это сделать.
Узел отмены имеет возможность использовать Regex , чтобы обнаружить столбцы для включения или исключения, но я не могу сделать это work.
Доступными столбцами для включения / исключения являются несколько названий полей, таких как провинция / штат, страна / регион, широта, долгота, а также длинный список столбцов даты в формате m/d/yy
(или m/dd/yy
если позже в этом месяце). Данные Джона Хопкинса для США имеют аналогичный формат, но с дополнительными столбцами для округов, изокодов и т. Д. c.
Все столбцы с датами представлены в этом году (т. Е. 2020).
- Для верхней части узла Unpivoting, где указаны столбцы значений, я могу сделать то, что мне нужно, с помощью параметра подстановочного знака и шаблона
*/*/20
- Для нижней части узла Unpivoting мне нужно подстановочный знак или выражение Regex, чтобы указать все остальные столбцы.
Все остальные столбцы содержат буквы алфавита. Ни один из них не имеет формат м / д / гг. Поэтому какой-то тип Regex, который включает в себя любой столбец с алфавитными именами столбцов или указывает НЕ m/d/yy
, должен сработать.
Я попытался использовать [\s\S]+
для помощи в написании Regex, но кажется, ничего не работает. Я ценю любую помощь.