唐小僧靠谱吗:如何用正则表达式去掉HTML标签

来源：百度文库编辑：中财网时间：2024/04/28 04:02:03

如何用正则表达式去掉HTML标签[问题点数:40分]

hjsx007
(hjsx007)
等　级：

结帖率：0.00%
楼主发表于：2009-12-28 20:30:33

关键业务能部署云计算吗？什么是AppUp云服务？什么是打造云平台的关键？什么是打造云平台的关键？云计算面临的安全问题有哪些？

我现在做一个网站，新闻文字内容从数据库中content列（自己建的）读出，但content中有诸如

等html标签，而新闻字数又是只能显示前面一部分的，需要截取，只有替换掉这些标签截取的才是字符，不然例如截取到地20个字符恰好是"<"的话，显示出来就不是文字了，要在后台把这些符号替换掉，怎么办呀？大侠们……

alifriend
(波导终结者)
等　级：

5
4
#1楼得分：0回复于：2009-12-28 20:35:52
C# code
(<=\<.+\>)[^\<]+(=\)
取出标签中的内容，试试
对我有用[0]
丢个板砖[0]
引用
举报
管理
TOP
精华推荐：数据库类的扩展:数据库的建立和表的建立

wuyq11
(人生如梦)
等　级：

3
21
3
更多勋章
#2楼得分：0回复于：2009-12-28 20:35:58
string str=System.Text.RegularExpressions.Regex.Replace("", @"<[^>]*>", "");
Htmlstring = Regex.Replace(Htmlstring, @" ]*?>.*? ", "", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @" <(.[^>]*)>", "", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"([\r\n])[\s]+", "", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"-->", "", RegexOptions.IgnoreCase);
对我有用[0]
丢个板砖[0]
引用
举报
管理
TOP
精华推荐：[攒分贴]用c#读取并分析sql2005日志

wxg22526451
(旋风)
等　级：

#3楼得分：0回复于：2009-12-28 20:39:44
C# code
///

/// 去除 HTML tag ///

/// 源 /// 结果 public static string StripHTML(string HTML) //google "StripHTML" 得到{ string[] Regexs = { @"]*?>.*?", @"<(\/\s*)?!?((\w+:)?\w+)(\w+(\s*=?\s*(([""'])(\\[""'tbnr]|[^\7])*?\7|\w+)|.{0})|\s)*?(\/\s*)?>", @"([\r\n])[\s]+", @"&(quot|#34);", @"&(amp|#38);", @"&(lt|#60);", @"&(gt|#62);", @"&(nbsp|#160);", @"&(iexcl|#161);", @"&(cent|#162);", @"&(pound|#163);", @"&(copy|#169);", @"&#(\d+);", @"-->", @"

唐小僧 靠谱吗:如何用正则表达式去掉HTML标签

唐小僧靠谱吗:如何用正则表达式去掉HTML标签