明凯博客

关注网站技术,一个特立独行的程序员

Js去掉html标签的正则表达式

1,得到网页上的链接地址:

1
2
string matchString = @"<a [^>]+href=\s*(?:'(?<href>[^']+)'|""(?</href><href>[^""]+)""|(?</href><href>[^>\s]+))\s*[^>]*>";
</href></a>

2,得到网页的标题:

1
string matchString = @"<title>(?</title><title>.*)</title>";

3,去掉网页中的所有的html标记:

1
string temp = Regex.Replace(html, "< [^>]*>", ""); //html是一个要去除html标记的文档

4, 标题:

1
string matchString = @"<title>([\S\s\t]*?)</title>";

5,js去掉所有html标记的函数:

1
2
3
4
function delHtmlTag(str)
{
return str.replace(/< [^>]+>/g,"");//去掉所有的html标记
}

, , , , ,

相关文章

发表评论

电子邮件地址不会被公开。 必填项已用*标注