3.3 论坛网页正文抽取研究

3.3 论坛网页正文抽取研究

如前文所述,网络上各种不同平台的网页结构往往不同。例如新闻门户、微博、微信公众号、论坛等。其中新闻门户和微信公众号页面的抽取方法基本是可以通用的,这在前一节我们已经研究过。