获取指定长度html代码摘要的js函数

liudaoru

浏览: 1559238 次
性别:
来自: 北京

最近访客更多访客>>

fantaxy025025

金武飞扬

2720851545

talkweb_xiang

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

Ajax

HTML

var getAbstract=function(n){
        n=(n)?parseInt(n)-1:-1;//0 - n-1的字符长度为n.
        var html=null;
        if (config.htmlOn == true)
        {
            var div=document.createElement("DIV");
            div.innerHTML=Editor.editor.contentWindow.document.body.innerHTML;
            html=div.innerText;
            delete div;
        }
        else
        {
            html=Editor.editor.contentWindow.document.body.innerHTML;
        }
        html=html.replace(/<\s*script[^>]*>.*<\s*\/script[^>]*>/ig,"").replace(/<\s*script[^>]*>/ig,"").replace(/<\s*\/script[^>]*>/ig,"");
        if(n>0)
        {
            //匹配所有的HTML Tag
            var pattern='<[^>]*>';
            var reg = new RegExp(pattern,'ig');
            var lastIndex=n;
            var arr;
            //循环直到第n个字符在当前匹配式之间或者之前时跳出
            while ((arr = reg.exec(html)) != null)
            {
                //当下一个匹配式<*>(表示为Tag)的起始位置超过n，则表示第n个字符处在当前匹配式之前
                if(arr.index>=n)break;
                //此时两种情况，一种是第n个字符在当前匹配式之间,另一种是当前匹配式在第n个字符之前
                lastIndex=arr.lastIndex;
                //当下一个匹配式<*>(表示为Tag)的结束位置超过n，则表示第n个字符处在当前匹配式之间
                if(lastIndex>=n)break;
            }
            //为了不截断第n个字符附近的Tag，需要根据情况重新指定截断的位置
            //第n个字符在循环中跳出时的匹配式之间的时候，需要将n指定到该匹配式的结束处，以免截断
            if(lastIndex>n)n=lastIndex;

            //匹配一些不能被截断的前后都必须有的HTML TAG
            var tags='table|div|span|b|i|u|ul|ol|strong|embed|object|center|strike|iframe';
            function recursionRegular(n)
            {
                if(n==1)
                {
                    return '[^<]*((<\s*\\1[^>]*'+'.*'                 +'</\s*\\1[^>]*>)|(<(?!/?\s*\\1)[^>]*>[^<]*))*[^<]*';
                }
                else
                {
                    return '[^<]*((<\s*\\1[^>]*'+recursionRegular(n-1)+'</\s*\\1[^>]*>)|(<(?!/?\s*\\1)[^>]*>[^<]*))*[^<]*';
                }
            }
            pattern='<\s*('+tags+')[^>]*>'+recursionRegular(4)+'</\s*\\1[^>]*>';
//          pattern='<\s*(table|div|span|b|i|u|ul|ol|strong|embed|object|center|strike|iframe|button)[^>]*>[^<]*</\s*\\1[^>]*>';
            reg = new RegExp(pattern,'ig');
            //循环直到第n个字符在当前匹配式之间或者之前时跳出
            while ((arr = reg.exec(html)) != null)
            {
                //当下一个匹配式<*>(表示为Tag)的起始位置超过n，则表示第n个字符处在当前匹配式之前
                if(arr.index>=n)break;
                //此时两种情况，一种是第n个字符在当前匹配式之间,另一种是当前匹配式在第n个字符之前
                lastIndex=arr.lastIndex;
                //当下一个匹配式<*>(表示为Tag)的结束位置超过n，则表示第n个字符处在当前匹配式之间
                if(lastIndex>=n)break;
            }
            //为了不截断第n个字符附近的Tag，需要根据情况重新指定截断的位置
            //第n个字符在循环中跳出时的匹配式之间的时候，需要将n指定到该匹配式的结束处，以免截断
            if(lastIndex>n)n=lastIndex;

            return html.substring(0,n);
        }
        else
        {
            return html;
        }
}

分享到：

过滤html标记中某个属性的方法 | web颜色拾取器[z]

2008-01-08 09:24
浏览 2836
评论(0)
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

获取指定长度html代码摘要的js函数

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

获取指定长度html代码摘要的js函数

评论

发表评论

相关推荐

几个不错的ff下调试插件

20 种提升网页速度的技巧

25 个在 Web 中嵌入图表的免费资源

15个网站用户体验优化禁忌

让IE8兼容IE7

FF下分析页面加载的工具

IE6下页面显示空白的问题

支持IE6、IE7的关闭页面的函数

很弱很无奈的一段代码（打开的页面更新父窗口的链接）

js小脚本

处理一次性事件的模式

Linux：rsync服务器的快速搭建和使用

js导致的页面空白问题

IE6下history.back无效的问题

浏览器兼容比较好的设置min-width的方式

CSS代码分享：浏览器CSS Reset方法十例zz

在Javascript中，什么是闭包(Closure)

Unicode、GB2312、GBK和GB18030中的汉字[转]

空字符串的split

docType 相关的loose.dtd导致的无法获取scrollTop的解决

最近访客更多访客>>