Я пытаюсь извлечь некоторую часть строки и сохранить ее в столбце hbase.
Содержимое файлов:
msgType1 Person xyz has opened Internet:www.google.com from IP:192.123.123.123 for duration 00:15:00
msgType2 Person xyz denied for opening Internet:202.x.x.x from IP:192.123.123.123 reason:unautheticated
msgType1 Person xyz has opened Internet:202.x.x.x from IP:192.123.123.123 for duration 00:15:00
Исправлен шаблон сообщений, соответствующих msgType.Теперь я пытаюсь сохранить имя человека, место назначения, источник, продолжительность и т. Д. В базе данных.
Я пытаюсь написать скрипт в PIG, чтобы выполнить эту задачу.Но я застрял при извлечении части (извлечение IP-адреса или имени веб-сайта из токена 'Internet: 202.xxx' внутри строки).
Я пробовал регулярное выражение, но оно не работает для меня.Regex всегда выдает эту ошибку:
ERROR 1045: Could not infer the matching function for org.apache.pig.builtin.REGEX_EXTRACT as multiple or none of them fit. Please use an explicit cast.
Есть ли другой способ извлечь это значение и сохранить его в hbase в PIG или в другом месте, кроме PIG?