www.cftea.com

HtmlAgilityPack(HAP)像处理 XML 一样处理 HTML-初次使用

ITPOW2019/8/14 13:36:57

HtmlAgilityPack(HAP)是 .NET 平台下一款处理 HTML 的 dll。

将 dll 拖入 Visual Studio 并添加引用之后,直接写代码即可,如下实现了从网络上抓取网页,并像 XML 一样拆解分析网页。

如上是一个 HtmlAgilityPack(HAP)的应用示例。关键点:

  • HtmlWeb.Load -> HtmlDocument
  • HtmlDocument 可以使用 SelectNodesSelectSingleNodeHtmlNodeCollectionHtmlNode 等像 XML、XPath 一样的处理。

下载 HtmlAgilityPack(HAP)

<<返回首页<<