正则表达式,提取网页中的链接地址
<td class=cate width="45%" style="word-break:break-all">
<a class=M href="http://jmfengcai.cn.alibaba.com/athena/companydetail/jmfengcai.html" onMouseDown="return aliclick(this,'?alishop=companylistcompanyname');" target="_blank" class=M>江门市蓬江区凤彩工艺厂</a>
<br>
代码如上.我请问如何用正则表达式,把"http://jmfengcai.cn.alibaba.com/athena/companydetail/jmfengcai.html"提取出来?
代码如下:
/(http:\/\/\[^" ']+)/gm
/href *= *['"]*(\S+)["']* */gm
根据不同需要选择。
相关推荐
-
php正则表达式取得内容所有链接的方法
本文实例讲述了php正则表达式取得内容所有链接的方法.分享给大家供大家参考.具体如下: 这里提供二款关于php正则链接的方法,他们可以取得内容所有链接并且保存到一个数组,当然也可以把链接全部替换. 方法一,代码如下: 复制代码 代码如下: function get_all_url($code){ preg_match_all('/<as+href=["|']?([^>"' ]+)["|']?s*[^>]*>([^>]+)<
-
php 自写函数代码 获取关键字 去超链接
1.根据权重获取关键字 复制代码 代码如下: function getkey($contents){ $rows = strip_tags($contents); $arr = array(' ',' ',"\s", "\r\n", "\n", "\r", "\t", ">", "“", "”"); $qc_rows = str_replac
-
php获取网页上所有链接的方法
本文实例讲述了php取得网页上所有链接的方法.分享给大家供大家参考.具体实现方法如下: 复制代码 代码如下: <?php function get_all_url($code){ preg_match_all('/<as+href=["|']?([^>"' ]+)["|']?s*[^>]*>([^>]+)</a>/i',$code,$arr); return array('name'=>$arr[2],'u
-
ASP超级链接和HTML函数正则表达式 修正版
过滤超级链接 复制代码 代码如下: Function RegRemoveHref(HTMLstr) Set ra = New RegExp ra.IgnoreCase = True ra.Global = True ra.Pattern = "<A[^>]+>(.+?)<\/A>" RegRemoveHref = ra.replace(HTMLstr,"$1") END Function 过滤所有HTML代码 复制代码 代码如下: Fu
-
PHP获取短链接跳转后的真实地址和响应头信息的方法
获取到一个短连接,需要将短连接转换成真实的网址,通过查资料,发现 PHP 提供了一个函数 get_headers() ,可以完成这个任务,先把 头部信息获取到,然后再分析跳转地址即可: 复制代码 代码如下: $url = 'http://t.cn/h5mwx'; $headers = get_headers($url, TRUE); print_r($headers); //输出跳转到的网址 echo $headers['Location']; 附完整数组: 复制代码 代码如下: Array (
-
PHP使用正则表达式清除超链接文本
可以用$str = preg_replace("/<a[^>]*href=[^>]*>|<\/[^a]*a[^>]*>/i","",$strhtml); 这段来实现需求,如果想要更多解决方法,可以参看以下的. 1.删除内容中的超链接 复制代码 代码如下: ereg_replace('<a([^>]*)>([^<]*)</a>','<font color="red"
-
php正则表达式获取内容所有链接
方法一: function get_all_url($code){ preg_match_all('/<as+href=["|']?([^>"' ]+)["|']?s*[^>]*>([^>]+)</a>/i',$code,$arr); return array('name'=>$arr[2],'url'=>$arr[1]); } 方法二: /** * date 2015-07-24 **/ $site=substr($ur
-
node.js正则表达式获取网页中所有链接的代码实例
实现代码 复制代码 代码如下: var http = require('http'); //定义函数var getAHref = function(htmlstr){ var reg = /<a.+?href=('|")?([^'"]+)('|")?(?:\s+|>)/gim; var arr = []; while(tem=reg.exec(htmlstr)){ arr.push(tem[2]); } return a
-
java正则表达式匹配网页所有网址和链接文字的示例
复制代码 代码如下: import java.io.BufferedReader;import java.io.IOException;import java.io.InputStreamReader;import java.net.MalformedURLException;import java.net.URL;import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.
-
php 正则表达式提取网页超级链接url的函数
复制代码 代码如下: function match_links($document) { preg_match_all("'<\s*a\s.*?href\s*=\s*([\"\'])?(?(1)(.*?)\\1|([^\s\>]+))[^>]*>?(.*?)</a>'isx",$document,$links); while(list($key,$val) = each($links[2])) { if(!empty($val)) $mat
随机推荐
- Angular2 自定义validators的实现方法
- 批处理显示当前ip(局域网)
- ASP.NET设置404页面返回302HTTP状态码的解决方法
- php面向对象中的魔术方法中文说明
- PHP中使用asort进行中文排序失效的问题处理
- PHP检查网站是否宕机的方法示例
- 利用JS屏蔽页面中的Enter按键提交表单的方法
- JavaScript快速切换繁体中文和简体中文的方法及网站支持简繁体切换的绝招
- 深入理解bootstrap框架之第二章整体架构
- jquery.blockUI.js上传滚动等待效果实现思路及代码
- jquery live()调用不存在的解决方法
- JS 判断代码全收集
- IIS自定义404错误页避免暴露.NET网站路径信息
- 计算机硬件注册表修改实例(一)
- PHP单例模式详解及实例代码
- C# ListView 点击表头对数据进行排序功能的实现代码
- 一款支持混合多线路接入的LINUX软路由
- Python面向对象之继承代码详解
- python爬虫正则表达式之处理换行符
- 对DJango视图(views)和模版(templates)的使用详解
