Извлечь текст из веб-страницы, отображаемой в TWebBrowser - PullRequest
3 голосов
/ 28 января 2010

Я использую Delphi 7 и хотел бы извлечь ТОЛЬКО текст, отображаемый на веб-странице, непосредственно с веб-страницы, отображаемой в TWebBrowser (без изображений ....). Можно ли это сделать и как я могу это сделать?

Ответы [ 2 ]

6 голосов
/ 28 января 2010

Я использовал следующее ...

procedure TForm1.WebBrowser1DocumentComplete(Sender: TObject;
  const pDisp: IDispatch; var URL: OleVariant);
 var
  Document: IHtmlDocument2;
begin
  edit1.text:=url;
  document := webbrowser1.document as IHtmlDocument2;
  memo2.lines.add(trim(document.body.innerhtml));  // to get html
  memo1.lines.add(trim(document.body.innertext));  // to get text
end;
1 голос
/ 28 января 2010

Если вы хотите загрузить это в TRichEdit, то я предлагаю посмотреть на компонент WPTools , который имеет возможность загружать данные из потока HTML и экспортировать в формате RTF. Я использую этот компонент для обработки моего внутреннего редактора электронной почты (который, по-видимому, вам нужен).

...