webarticle 基于Python3 一种新的网页正文抽取算法代码,对广告屏蔽很有效 部分代码的想法来源于 《基于行块分布函数的通用网页正文抽取》 这篇论文。 测试请参考 onlytest.py 服务器运行参考 webarticle.py