Получить текст из HTML программно - PullRequest
0 голосов
/ 13 февраля 2019

Итак, на моей работе мне иногда приходится вводить данные со страницы HTML в файл Excel вручную.Обычно это что-то вроде списка предложений курса, где я должен получить название, тип степени, ссылку на страницу и другую информацию.Есть ли способ, которым я могу программно справиться с этим?У меня есть навыки начального и среднего уровня программирования на Java, Python и PHP, и у меня есть очень прочная основа в Web Dev.Любая помощь будет оценена.

Концептуально из того, что я понимаю, я должен был бы сделать цикл, чтобы найти определенный текст между тегами / классами, а затем сбросить его в другой текстовый файл?Оттуда я довольно растерялся.

Пробовал поиск и не смог найти решение, которое помогло.Был бы признателен за ссылки или новый ответ, просто пытаясь понять, что делать.Еще раз спасибо, надеюсь, я не слишком похож на идиота LOL

Ответы [ 2 ]

0 голосов
/ 13 февраля 2019

нашел то, что искал, благодаря некоторым комментариям к этому посту.Я пошел дальше и сделал цикл, показанный ниже:

var Array = [];
$('.class').each(function () {
    Array.push(this.innerHTML);
});
0 голосов
/ 13 февраля 2019

Для начала я хотел бы использовать JavaScript для получения значений между тегами.

Более конкретно, вас заинтересует свойство innerText элементов DOM:

var x = document.getElementById("myBtn").innerText;

В нем будет храниться текст элемента с идентификатором «myBtn» в переменной x.

https://www.w3schools.com/jsref/prop_node_innertext.asp

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...