欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  web前端

javascript如何实现html字符转实体

程序员文章站 2022-03-11 20:08:05
...

方法:1、使用innerHTML设置或获取标签所包含的HTML+文本信息(从标签起始位置到终止位置全部内容,包括HTML标签);2、使用innerText设置或获取标签所包含的文本信息(从标签起始位置到终止位置的内容,去除HTML标签)。

javascript如何实现html字符转实体

本教程操作环境:windows7系统、javascript1.8.5版、Dell G3电脑。

针对这个问题,可以分为两种情况:一种是只包含&、<、>、'的html实体,另一种是广义的实体,不只局限于上面的情况。对于后者,在我看来,除了列举出所有的实体符号,写switch case语句,还真的没有什么好办法。(如果您有什么好办法,请不吝赐教。)。针对前者的话,其实原生js就支持。例如会自动对文本中存在的HTML语法字符(小于号、大于号、引号及和号)进行编码的节点的innerText属性(FireFox中是textContent属性。

实际上二者并不完全一样,innerText会忽略行内样式和脚本,而textContent则会原样返回行内样式和文本。)。其原理是设置innerText会生成当前节点的一个子文本节点,而为了确保只生成一个子文本节点,就需要对文本进行HTML编码。innerHTML虽然也可以做到,但它转变的只是标签的文本。下面的例子展示了它们的不同。

var div=document.createElement('div');
div.innerText='<p>hello & world</p>';
div.innerText //<p>hello & world</p>"
div.innerHTML //"&lt;p&gt;hello &amp; world&lt;/p&gt;"

div.innerHTML='<p>hello & < world</p>'
div.innerHTML //"<p>hello &amp; &lt;  world</p>"
div.innerText //"hello & < world"

从上面例子中可以看到二者的区别:innerText会将所有的文本转义(当然也不是全部文本,比如空格就不会),innerHTML则是对标签內的文本进行转义,标签如<p>就不会转义,但孤立的小于大于号还是会进行转换的。(上面代码中innerHTML之所以设置的内容和解析后的内容不一样,是因为返回的是浏览器根据原始字符串解析为DOM树后经过序列化之后的结果。)根据上面程序的结果,我们可以得到简单的转换函数:

//仅限于包含`&、<、>、'`的文本转换
function stringToEntity(str){
  var div=document.createElement('div');
  div.innerText=str;
  div.textContent=str;
  var res=div.innerHTML;
  console.log(str,'->',res);
  return res;
}

其实除了innerText,还可以通过创建文本节点的方式来完成转义,即使用document.createTextNode()。这种方法大部分的应用场景是对用户输入进行转义。例如业务需要,我们需要把用户的输入写到网页上,不做转义直接将用户输入写到网页上往往是行不通的,因为容易出现XSS漏洞。不过我们可以通过document.createTextNode()方法将用户输入作为文本节点,然后再插入到文档中。该方法会对出现的特殊标记进行转义。例如如下代码:

var str="<img src='a valid url' οnlοad='alert(1)'></img>";
var text=document.createTextNode(str);
$("container").appendChild(text);

上述代码中如果不加转义直接使用$("container").innerHTML=str;就会使得图片加载完运行onload里面的代码,如果代码是恶意的,就会为我们网站的用户造成损害。而将小于号、大于号转义后就不会出现这个问题了。

【推荐学习:javascript高级教程

以上就是javascript如何实现html字符转实体的详细内容,更多请关注其它相关文章!

相关标签: JS