HTML高亮关键字的实现代码
本以为一个 innerhtml replace 就能实现的简单操作,却遇到了许多的问题。本文就记录这些问题和最终的完美解决办法, 希望能对有同样遭遇的小伙伴有所帮助。只对结果感兴趣的,忽略过程,直接跳过看结果吧~
常用做法:正则替换
思路:要想高亮元素,那么需要将关键字提取出来用标签包裹,然后对标签进行样式调整。使用 innerhtml,或 outhtml, 而不能使用 innertext,outtext。
const regex = new regexp(keyword,"g") element.innerhtml = element.innerhtml.replace(regex,"<b class="a">"+keyword+"</b>") element.classlist.add("highlight")
这样做存在的隐患有如下:
- keyword 如果是 ()\ 等正则对象的关键字将会构建正则对象失败。(可以通过转义解决)
- keyword 如果是一些 html 标签如 div 将会对 innerhtml 进行错误的替换
- keyword 如果和一些dom属性名、值相同,也会导致异常替换。如下当 keyword 为 test 时,会将 class 名也错误的替换掉:
<div id="parent"> <div class="test">test</div> </div>
关键字父节点 element 通过 class 来进行背景染色处理,对原始dom有一定程度污染,可能对 element 再次定位造成影响。(作为插件希望尽可能少改变原始dom)
正则优化一:仅处理位于标签内的元素
var formatkeyword = text.replace(/[-\/\\^$*+?.()|[\]{}]/g, '\\$&') // 转义处理keyword包含的特殊字符,如 /. var finder = new regexp(">.*?"++".*?<") // 提取位于标签内的文本,避免误操作 class、id 等 element.innerhtml = element.innerhtml.replace(finder,function(matched){ return matched.replace(text,"<br>"+text+</br>) })// 对提取的标签内文本进行关键字替换
以能解决大多数问题,但依旧存在的问题是,只要标签属性存在类似 < 符号,将会打破匹配规则导致正则提取内容错误, html5 dataset 可以自定义任意内容,故这些特殊字符是无法避免的。
<div dataset="p>d">替换</div>
正则优化二:清除可能影响的标签
<div id="keyword">keyword</div> =》将闭合标签用变量替换 [replaced1]keyword[replaced2]//闭合标签内 id="keyword" 不会被处理 =》 [replaced1]<b>keyword</b>[replaced2] =》将暂存变量 replaced 替换为原先标签 <div id="keyword"><b>keyword</b></div>
这种思路及源码从这里来, 但存在问题是:
- 如果 [replaced1] 包含 keyword, 那么替换时将发生异常
- 最重要的,当标签值中包含 <> 符号时,此方法也不能正确的提取标签
总之在经过了n多尝试之后,通过正则都没能有效的处理各种情况。然后换了个思路,不通过字符串的方式,通过节点处理。element.childnodes 可以最有效的清理标签内的干扰信息。
[完美解决方案]通过 dom 节点处理
<div id="parent"> keyword 1 <span id="child"> keyword 2 </span> </div>
通过 parent.childnodes 得到所有子节点。child 节点可以通过 innertext.replce(keyword,result) 的方式替换得到想要的高亮效果,如下: <span id="child"><b>keyword</b> 2</span> (递归处理:当child节点不含子节点时进行replace操作)。
但是 keyword 1 是属于文本节点,只能修改文本内容,无法增加 html,更无法单独控制其样式。而文本节点也不能转换为普通节点,这也是最苦恼的事情。
最后~,本文的重点来了,因为这个功能,让我第一次认真接触到了文本节点这个东西。从这里发现了text,使用切割文本节点并替换的方式实现高亮。
const reg = new regexp(keyword.replace(/[-\/\\^$*+?.()|[\]{}]/g, '\\$&')) highlight = function (node,reg){ if (node.nodetype == 3) { //只处理文本节点 const match = node.data.match(new regexp(reg)); if (match) { const highlightel = document.createelement("b"); highlightel.dataset.highlight="y" const wordnode = node.splittext(match.index) wordnode.splittext(match[0].length); // 切割成前 关键词 后三个text 节点 const wordnew = document.createtextnode(wordnode.data); highlightel.appendchild(wordnew);//highlight 节点构建成功 wordnode.parentnode.replacechild(highlightel, wordnode);// 替换该文本节点 } } else if (node.nodetype == 1 && node.dataset.highlight!="y" ) { for (var i = 0; i < node.childnodes.length; i++) { highlight(node.childnodes[i], reg); i++ } } }
最后,留个彩蛋,以上方法也是存在一个小 bug 的,有兴趣可以去发现一下。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。