如何写出扩展性良好的前端代码（揭秘前端字符的戏精之路）

如何写出扩展性良好的前端代码（揭秘前端字符的戏精之路）

2024-11-06 01:52:46 作者:尔等平身网址:https://m.xinb2b.cn/life/gir493506.html

前言

编码，是每个程序员绕不开的话题。对于前端工程师而言，字符更是会直观地展示在界面上。

提起文字，大部分人的脑中，都会定式为规整排列的字符。但是林子大了什么鸟都有，世界上可是存在着6800 种文字，难免会飞出来一些诡异的鸟…

而号称“万国码”的Unicode，在实现编码与展示的时候，也会不会遇到一些奇葩的事情呢？

事实上，可能你早已见识过了：

x̙͈̝͍͕̙̄͛̽̆͌́̕͟g̘̣̠̝̟̤̥̼̼̽͑͋̈̑̒͟͞q̛̤̦̝̘͎͋̔̋͌͒̆̋̚͡f̵̢̙͇̮̠̋̀͌̅̉̃̔͜͜͠͡r̢̜̩͙̭̲͓͈̈̀͑̆͋̚͢͜m̷̛͙̝̣̲̭͍͉̊̓̾̈̋̿̚͢͟͠s̷̡̩͔̮͈̜̊̽͂̆̈́̃̓͋̏

热҈的҈字҈都҈出҈汗҈了҈

你的屏幕被蓝翔挖掘机给挖坏了不信你看;̷̸̨̀͒̏̃ͦ̈́̾̀́̎͢҉̵̶͚̼͉͖̺̥͔͇̰̹̮͙͉̻̼̭̻͕̮͇ͨͬͪ͗̇̑̽͋̀̋̊͌ͧͨͭ̓̅͐ͥ̂̔̊ͧ͊҉̶̵̷̞̩̦̳̺̳̬̬̩̣̫͇̯̥͖͍͕̠̦̼̗ͯ̽͌̔ͪͯ́́͋̍ͨ̿̿̎͒ͤ̓̅̀͂ͧ͋̏ͫͣ̔͘͜͠͏̶̵̸̧̧̥̺͓̘̺͎̜̥͕͈̝̫͎̺̮̱̤̠̠͖̳̻̥̣̪͍͕͇̮͙̹̪ͮͧͫ͂͒ͤͣ̌̽ͨͪ͒̄̄̉̒̊ͩ̅͆͘̚͘͘̚͟͟͝ͅ

今天我们就来探讨一下这些奇怪的字符。

一、文字可以戴帽子和穿鞋子

提起泰文，很多朋友都会立即想到：萨瓦迪卡（你好）。

但这句话是怎么写的呢？

其实这句你好，男生和女生之间还有差异，男生写法是：สวัสดีครับ，女生则是：สวัสดีค่ะ。

不过这并不重要，重要的是，我们发现某些字的上面，还带了特殊的符号。就好像是戴上了帽子。

事实上，泰文字符不仅会“戴帽子”，偶尔还会“穿鞋子”。

比如下面三个字符：ผ ผู ผู้

如果脑洞再大一点，有人就会想，那是不是还可以戴多顶帽子呢？

的确如此…泰文允许你穿一双鞋子，并且戴两顶帽子。完整的形式是这样的：

所以，平时看惯了中英文的我们，需要改变一下思路了。

世界上的文字，并不全是规规整整横向排列的格子，也存在像泰文这种变形金刚组合式的文字。

虽然标准的泰文里，“帽子”和“鞋子”的数量是有限制的，但由于国际码的迷之设计（先卖个关子），在计算机里显示的泰文字符，却可以拥有无数的帽子和鞋子。也就是说，它变成了一款可以在Y轴无限拓展的文字！

并且，咱不光可以往上喷，还可以有一定角度…

还可以

，简直是不讲道理。

（由于一些系统会崩溃，这里使用截图）

二、人与机器的矛盾

然后我们会质问Unicode，你为何不讲道理？

如此的设计，近乎是一个bug；但即使是bug，也应该早就修复了呀。

事实上，这样的设计，是为了解决一个问题：人与机器的矛盾。

首先是存储的矛盾。

如果把每个组合好的泰文用一个编码来表示，那么至少需要44×21×4=3696个编码（实际上可能要比这还多）。用如此多的编码来处理基本元素只有69个的文字是非常浪费的，因此电脑采用一套称为复杂文字编排（CTL）的设计来解决矛盾。

简单的说，泰文的每个基本字符对应一个编码，用户在输入法里依次输入多个基本字符进行拼合，最后敲一个特殊的“结束字符”；这时前面输入的基本字符，就拼合成了一个单独的泰文字符，在屏幕中显示。这样就解决了存储的空间浪费问题。

但这样就带来了第二个矛盾，识别的问题。

人可以轻松地识别一个泰文合字是否拼写正确、有意义；但机器在显示时却很难进行判断，即使可以也会带来相应的性能问题。

如何解决呢？如今会在输入法上做一些文章，比如打一个声调符号后就不能再输入了。不过，由于泰文这种基于结束标志合成字符的本质，你还是没法避免“艺术家”们使用复制粘贴、手工撰改字符位置等方式去进行创造，只能起到一些限制作用。

其次，在比较新版本的Webkit里，在显示上会阻止这种往上下冒的字符，这样至少不影响排版。所以有部分字符已经不会出现上下叠加的情形了，你可以在不同浏览器，观察一下这个字符的显示：ส็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็

三、萌即正义的颜文字 (ง •̀_•́)ง

也许你觉得泰文奇葩，但它的声调就在文字里，看到就能准确地读出来。这样更容易传播，是不是也没了你读文言文要查字典的烦恼呢？所以文字的设计各有优劣。

这样的设计不止泰文，它只是一个典型的例子。除此之外常见的还有老挝文、藏文。

脑洞大开的艺术家们，又会想到另外一个好玩的事情：我能不能拿老挝文的“帽子”，组合“藏文”的鞋子，合成一个独立的字符呢？

他们赢了。不久，颜文字开始流行。

比如，这个表情：(;´༎ຶД༎ຶ`)

里面有眼睛流泪的一个字符：༎ຶ

它是什么语言呢？

事实上，它并不属于世界上任何一种语言！眼睛部分是老挝文，泪水部分属于藏文。

但是，你在复制它的时候，可以发现它却是一个单独的字符，这就非常的神奇。原因我们在第二部分已经讲过了。

我是如何知道的呢？当然我并不是个语言学家，我们可以转码一下，发现༎ຶ对应的编码是\u0f0e\u0eb6，再到 unicode-table 里去查看就清楚了。

除此之外——

▷ˋε´◁ 中 ε 是希腊字母

ʕ-'ᴥ’-ʔ 中 ʕᴥʔ 是国际音标

(·ཀ·」∠) 中 ཀ 是藏文

(ง •̀_•́ )ง 中 ง 是泰文

罒 д 罒中罒是中文（同网），д 是俄语西里尔字母

看来如果你会发颜文字，就是名副其实的会“十八国语言”了呢 (๑✦ˑ̫✦)✧

四、字体的错位

前面我们一直在谈字符的本质，但字符在屏幕中的展示，还有一个关键的因素：字体。

相同的字符，使用了不同的字体，它们的显示也会有差别。

一行中文，你设置“黑体”或“草书”，它大体来看还是规整的；

但如果你设置一行英文为“草书”，可能就会有问题。

在浏览器里，如果对应编码在字体文件里为空，一般会展示成一个方格，起码不会影响其他正常字符的排版。但我们知道，Unicode的林子实在太大了…

在某些字体里，就会对一些特殊的字符产生错误的排版。

比如：热҈的҈字҈都҈出҈汗҈了҈

把它转义一下，就得到编码是： \u70ed\u0488\u7684\u0488\u5b57\u0488\u90fd\u0488\u51fa\u0488\u6c57\u0488\u4e86\u0488

其中0488就是҈这个字符的编码，它是一个组合用的西里尔文百千符号。

它在大部分常用字体里，都有错位问题；而其他一些字体，比如 Courier New 字体，则是分开的展示：

那么，这两种展示哪种才是正常的呢？其实都不正常。

我们查看西里尔文计数法的wiki，可以看到它只有配合西里尔数字时，才能展示正常：

至于你把它跟其他语言组合在一起时，我们要么看到错位，要么看到分离的展示。而且国际上并没有一个组织，去规定要怎么展示。事实上文字这么多，根本也管不过来，所以这也是混乱的原因。

最后补充一点，另外一小撮别有心裁的艺术家，还习惯使用这个字符去突破敏感词过滤…

五、混乱与创新？

值得一提的是，Unicode是不可阻挡的潮流，它也一直在更新。比如我们常用的Emoji表情，就已经是Unicode的标准字符集。

而前面我们说到，大家在玩这些奇奇怪怪的字符时，都是基于“类似bug”的设定在搞事情。这就有很大的局限性。

那“艺术家”们又会有些大胆的想法：我能不能主动创造一些新字符，就是为了错位和组合呢？

我也不清楚这是创新，还是会带来更多的混乱。但事实是，iOS系统自带的字符，已经有这样的尝试了。并且搜狗输入法在iOS系统提供的诸多符号里，挑选了一些，可供用户去使用。这个功能的名字，叫做花漾字。

还是得感慨艺术家们的视角是多么独特。

既然都这样了…最后，希望我们的国产表情包能有朝一日打入Unicode吧。

免责声明：转载自网络不用于商业宣传版权归原作者所有侵权删

手机如何扫描文件（如何使用手机扫描文件）
2024-11-06如何使用手机扫描文件工具/原料：智能手机，扫描全能王因为工作性质的关系，小编经常需要扫描一些文件在这里小编给大家推荐一个软件“扫描全能王”反正小编用起来挺顺手的我们先打开手机里的这款软件打开界面以后，点击屏幕右下角的相机。

生存技能必备技巧（8个生存技能你会几个）
2024-11-068个生存技能你会几个编者按人类最原始的8项生存技能（走、跑、跳、投、游、滑、翻、爬），你现在还会几个呢？当灾难来临，你是愿意留在原地等待救援，把生命交给未知，还是想要在危险来临的第一时间进行自救，把生命把握在自己的手中呢。

电脑自动黑屏怎么设置（电脑自动黑屏设置的方法）
2024-11-06电脑自动黑屏设置的方法点击【开始】菜单，在弹出的菜单中找到【控制面板】，点击【控制面板】按钮，进入【控制面板】选项；在【控制页面】点击【查看方式】后的选项，弹出选项中选择【大图标】；将【查看方式】更改为【大图标】将查看方式。

亲爱的热爱的电视剧甜合集（挚爱的曝杀青照）
2024-11-06挚爱的曝杀青照去年杨紫和李现主演的《亲爱的，热爱的》掀起风潮，而近日胡一天和李一桐合作的续集《亲爱的，挚爱的》正式杀青！2020上半年开拍了不少甜宠剧，这类型的剧是现在的剧大宗，近期也都相继杀青并释出新剧照，以下1。

中如何提取音频（如何从中提取音频）
2024-11-06如何从中提取音频在我们日常娱乐和日常工作中，当在遇见一段视频中的背景音乐很喜欢，但是没有下载渠道的时候，该怎么将背景音乐下载下来呢？如果需要将视频中的某段音频截取出来又该怎么办呢？今天小编就来和大家分享五款可以从视频。

维生素b2高血压能吃吗（维生素B2是高血压人群的）
2024-11-06维生素B2是高血压人群的众所周知，维生素是维持身体健康的必要营养成分，存在常见的食物中，人体不能自己合成，需要从食物中供给不同营养素作用也不一样，比如维生素B族，包括维生素B1、B2、B6、B12、叶酸等等，对于高血压人群尤。

隐形飞机隐形指的是什么
2024-11-06隐形飞机隐形指的是什么隐形飞机含义隐形飞机是让雷达无法侦察到飞机的存在，在现阶段中能够尽量或是消除雷达接受到的有用信号是秘密的军事机密之一，目前该技术已经受到了各个世界关注隐性飞机是通过多种隐性技术降低了飞机的信号特征，这。

迪士尼花木兰电影上映时间（迪士尼花木兰将于9月11日内地上映）
2024-11-06迪士尼花木兰将于9月11日内地上映9月2日，由刘亦菲主演的迪士尼真人电影《花木兰》内地正式定档9月11日该片主演还有甄子丹、巩俐、李连杰、杰森·斯考特·李等，刘亦菲将饰演首位“迪士尼华人公主”此外，影片原声中文配音也将在内地影院首秀该。

得了神经根型颈椎病怎么治疗好（的神经根型颈椎病）
2024-11-06的神经根型颈椎病神经根型颈椎病是颈椎病中发病率最高的类型，发病率高达50%-60%在临床上多见于中老年人，患有神经根型颈椎病的患者，不仅颈椎不舒服，上肢活动也会受限，有些还会手指发麻神经根型颈椎病是由于单侧或双侧脊神。

十大青年女科学家（不要忘记她们历史长河中的那些女科学家）
2024-11-06不要忘记她们历史长河中的那些女科学家|HAPPYWOMEN'SDAY谨以此文献给那些为人类文明做出卓越贡献的伟大女性，也祝广大劳动妇女三八国际妇女节快乐！前言说起伟大的女科学家，人们总会先想起两次获得诺贝尔奖的居里夫人以及成功提取出青蒿。

浙i江台风（台风正面袭杭周江勇）
2024-11-06台风正面袭杭周江勇台风“利奇马”穿越杭州北上，强风和暴雨给杭州市防台工作带来严峻考验8月10日上午，省委常委、杭州市委书记周江勇专程赴市防指检查部署防台工作，并召开视频会议周江勇强调，各地各部门要认真落实党中央、国务院。

3d演示颅底解剖图（纯手工详细标注颅底解剖）
2024-11-06纯手工详细标注颅底解剖来源：医学影像服务中心【版权声明】本平台属公益学习平台，转载系出于传递更多学习信息之目的，且已标明作者和出处，如不希望被传播的老师可与我们联系删除喜欢本期内容的求收藏求转发如果您有ct片问题也可以直接。