это моя первая запись о переполнении стека, поэтому, пожалуйста, будьте снисходительны, если у моего поста может быть какой-то недостаток с точки зрения качества.
Я хочу научиться работать с R и начать с простого примера -> Извлечение таблицы с сайта Википедии.
Мне удалось загрузить определенную страницу и определить интересующие меня разделы HTML:
<td style="text-align:right">511.000.000\n</td>
Теперь я хочу извлечь число в данных из таблицы с помощью регулярных выражений. Поэтому я создал регулярное выражение, которое должно соответствовать структуре числа с моей точки зрения:
pattern<-"\\d*\\.\\d*\\.\\d*\\.\\d*\\."
Я также пробовал другие варианты, но ни один из них не нашел число в HTML-коде. Я хотел оставить образец открытым, потому что числа могут быть сотнями, тысячами, миллионами, миллиардами.
- Мои вопросы: номер в HTML-коде, может быть
необходимо включить некоторый код для нечислового кода (который должен
не извлекается ...)
- Какая будет правильная версия для
шаблон для правильного определения номера?
Большое спасибо за вашу поддержку !!