唐小僧 靠谱吗:如何用正则表达式去掉HTML标签

来源:百度文库 编辑:中财网 时间:2024/04/28 04:02:03
如何用正则表达式去掉HTML标签[问题点数:40分]

hjsx007
(hjsx007)
等 级:
结帖率:0.00%
楼主发表于:2009-12-28 20:30:33
关键业务能部署云计算吗? 什么是AppUp云服务? 什么是打造云平台的关键? 什么是打造云平台的关键? 云计算面临的安全问题有哪些?
我现在做一个网站,新闻文字内容从数据库中content列(自己建的)读出,但content中有诸如

等html标签,而新闻字数又是只能显示前面一部分的,需要截取,只有替换掉这些标签截取的才是字符,不然例如截取到地20个字符恰好是"<"的话,显示出来就不是文字了,要在后台把这些符号替换掉,怎么办呀?大侠们……

alifriend
(波导终结者)
等 级:
5
4
#1楼 得分:0回复于:2009-12-28 20:35:52
C# code
(<=\<.+\>)[^\<]+(=\)
取出标签中的内容,试试
对我有用[0]
丢个板砖[0]
引用
举报
管理
TOP
精华推荐:数据库类的扩展:数据库的建立和表的建立

wuyq11
(人生如梦)
等 级:
3
21
3
更多勋章
#2楼 得分:0回复于:2009-12-28 20:35:58
string str=System.Text.RegularExpressions.Regex.Replace("", @"<[^>]*>", "");
Htmlstring = Regex.Replace(Htmlstring, @" ]*?>.*? ", "", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @" <(.[^>]*)>", "", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"([\r\n])[\s]+", "", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"-->", "", RegexOptions.IgnoreCase);
对我有用[0]
丢个板砖[0]
引用
举报
管理
TOP
精华推荐:[攒分贴]用c#读取并分析sql2005日志

wxg22526451
(旋风)
等 级:
#3楼 得分:0回复于:2009-12-28 20:39:44
C# code
///
/// 去除 HTML tag ///
/// 源 /// 结果 public static string StripHTML(string HTML) //google "StripHTML" 得到{ string[] Regexs = { @"]*?>.*?", @"<(\/\s*)?!?((\w+:)?\w+)(\w+(\s*=?\s*(([""'])(\\[""'tbnr]|[^\7])*?\7|\w+)|.{0})|\s)*?(\/\s*)?>", @"([\r\n])[\s]+", @"&(quot|#34);", @"&(amp|#38);", @"&(lt|#60);", @"&(gt|#62);", @"&(nbsp|#160);", @"&(iexcl|#161);", @"&(cent|#162);", @"&(pound|#163);", @"&(copy|#169);", @"&#(\d+);", @"-->", @"