排除特定内容 – 青春部落,流年似水 http://www.youthtribe.com 青春是一场远行,总记不起来时的路。 Mon, 05 Jan 2015 07:38:44 +0000 zh-CN hourly 1 https://wordpress.org/?v=6.1.6 排除特定内容 – 青春部落,流年似水 http://www.youthtribe.com/archives/1422 http://www.youthtribe.com/archives/1422#respond Mon, 05 Jan 2015 07:38:44 +0000 http://www.youthtribe.com/?p=1422 这两天写了个采集网页的小tool,遇到个问题是如何用正则表达式排除特定内容
我要采集一个网页的文章部分,我要替换掉一些不想要的标签为空,比如超链接,图片标签还有其他一些不想要的。。。
但是,我要保留这个段落标签,何解?经过搜索,确定用如下方法,去掉除

以外的其他html标签,主要是<>这样成对闭合的标签。

<(?!(p|(/p)))(.*?)>

?!是指排除,不匹配
p|(/p)就是或的意思啦。

]]>
http://www.youthtribe.com/archives/1422/feed 0