欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

ThinkSNS+ 是如何计算字符显示长度的

程序员文章站 2022-04-10 21:05:58
什么是ThinkSNS+ ThinkSNS(简称TS),一款全平台综合性社交系统,目前最新版本为ThinkSNS+、ThinkSNS V4 ThinkSNS【简】。 今天我们来聊一下可能很多人都会头疼的东西:显示长度。 需求是这样的,在字符的显示上,两个英文单词才占一个中文或者其他语言的显示长度。如 ......

什么是thinksns+

  thinksns(简称ts),一款全平台综合性社交系统,目前最新版本为thinksns+、thinksns v4 thinksns【简】。

今天我们来聊一下可能很多人都会头疼的东西:显示长度。

 

需求是这样的,在字符的显示上,两个英文单词才占一个中文或者其他语言的显示长度。如下:

 

上面排的是两个英文字母,一个汉字,一个emoji。你会发现,在显示上占的宽度是一致的。一些设计上为了好看也要求有这样的处理。

例如,我们的用户名需求是最多12个非单字节字符或者24个单字节字符的需求也可以混合排的需求,我们写后端不得不处理这样的验证了。

需求规则是  /^[a-za-z_\x7f-\xff][a-za-z0-9_\x7f-\xff]*$/

在thinksns+中,为了能把这部分验证公用,所以选择使用自定义验证规则。我们先说下计算的实现思路吧!

首先,就算是mb_strlen也没法准确的获取多字节字符和单子节字符混合在一起的长度,网上有个说法,汉字占三个字节,英文数组半角符号占一个字节,所以:

 

用这个方法可以得到单字节占0.5多字节占1的计算。但是以中文为例,只有两万个汉字才是这种情况,还有六万多汉字是四个,其次,emoji也是四个字节。根本无法准确的计算。

好在在无意间发现一个奇怪的东西str_word_count 这个函数计算非英文单词外是除了符号例如中文就是按照汉字个数算的,emoji也是同理。

发现这个以后,咱们就好办了。我们吧用户名中的 [a-aa-z0-9_] 剔除掉,单独计算不就是我们要的验证长度了吗?

所以,首先我们用:

 

方式单独计算出单字节字符的显示长度,再用:

 

方式计算出多字节的长度,最后:

 

就得出了显示长度,实现了,最后封装成验证规则:

 

代码是原型代码,还没有进行优化,之后我们只要按照下面的方式用:

 

现在就很好的解决了这个需求。

我们很乐意,将基于 laravel 的 thinksns+ 产品开发中的技术解决方案分享给大家,也希望喜欢的朋友能给国内开源产品一点点的支持。

往期研发日记回顾:

 

《thinksns+基于 laravel master 分支【研发日记一】》

《thinksns+研发中前端的抉择(webpack/vue)踩坑日记【研发日记二】》

《基于 laravel route 的 thinksns+ component【研发日记三】》

《如何做到 laravel 配置可以网站后台配置【研发日记四】》

 

开源代码仓库:

github:(点击star,每日关注开发动态。)