网站制作学习网PHP→正文:php正则获取a链接地址
字体:

php正则获取a链接地址

PHP 2011/4/7 18:24:16  点击:不统计

forasp.cn

php正则获取A链接地址,在做采集系统中用到了采集分页列表,列表中的全部链接都需要正则匹配出来,匹配出来后再进行url内容获取。

初步分析,首先是获取<a>的所有内容
第一次正则:/<a href=\"([\s\S]*)\">([\s\S]*)<\/a>/;
但是经过分析,如果a链接有title等属性,则不能获取到a了而且不能确定title的位置,那么假设前后都有,或者都没有,即在获

取地址内容正则中直接添加任意的非链接字符表达式即可。
于是修改:/<a([\s\S]*)href=\"([\s\S]*)\"([\s\S]*)>([\s\S]*)<\/a>/;
这样就可以获取到所有的a链接
获取的内容比如为$content;
preg_match_all("/<a([\s\S]*)href=\"([\s\S]*)\"([\s\S]*)>([\s\S]*)<\/a>/",$content,$arr);
那$arr[2][0]就是获取链接a的地址
那$arr[4][0]就是活的该链的文字显示内容。
php正则获取a链接地址


·上一篇:php采集器 >>    ·下一篇:php获取服务器环境 >>
推荐文章
最新文章