PHP实现基于文本的摩斯电码生成器

程序员文章站 2022-06-18 09:31:54

最近遇到一个基于输入文本生成摩斯代码音频文件的需求。几番搜索无果之后，我决定自己编写一个生成器。因为我希望通过web的方式访问我的摩斯代码音频文件，所以我决定采用p...

最近遇到一个基于输入文本生成摩斯代码音频文件的需求。几番搜索无果之后，我决定自己编写一个生成器。

PHP实现基于文本的摩斯电码生成器

因为我希望通过web的方式访问我的摩斯代码音频文件，所以我决定采用php作为我主要的编程语言。上面的截图显示了一个开始生成莫斯代码的网页。在下载的zip文件中，包含了用于提交文本的网页以及用于生成和展现音频文件的php源文件。如果你想测试php代码，你需要将网页和相关的php文件复制到启用了php的服务器上。

对于许多人来说，莫斯代码就像一些老电影中表现的那样，就是一些“点”和“横线”的序列，或者一连串的哔哔声。显然，如果你想用计算机代码来生成莫斯代码，这样的了解是远远不够的。这篇文章将会介绍生成莫斯代码的要素，如何生成wave 格式的音频文件，以及如何用php将莫斯代码转化成音频文件。

莫斯代码

莫斯代码是一种文本编码方式。它的优点是编码方便，而且用人耳就能够方便的解码。本质上，是通过音频（或者无线电频）的开和关，从而形成或短或长的音频脉冲，一般称作点（dot）和线（dash），或者用无线电术语称作“嘀”和“嗒”。用现代数字通信术语，莫斯代码是一种振幅键控（amplitude shift keying ，ask）。

在莫斯代码中，字符（字母，数字，标点符号和特殊符号）被编码成一个“嘀”和“嗒”的序列。所以为了把文本转化成莫斯代码，我们首先要确定如何来表示“嘀”和“嗒”。一个很显然的选择就是，用0表示“嘀”，用1表示“嗒”，或者反过来。不幸的是，莫斯代码采用的是可变长编码方案。所以我们也必须要使用一种可变长序列，或者采取一种方式，把数据打包成一种计算机内存通用的固定位宽（fixed bit-size）的格式。另外，需要特别注意的是，莫斯代码并不区分字母大小写，而且对一些特殊符号无法编码。在我们这个实现中，未定义的字符和符号将会被忽略。

在这个项目中，内存占用并不是一个需要特别考虑的问题。所以，我们提出一个简单的编码方案，即用“0”来表示每个“嘀”，用“1”来表示每个“嗒”，并且把他们放在一个字符串关联数组中。定义莫斯代码编码表的php代码就像下面这样：

$cwcode = array ('a'=>'01','b'=>'1000','c'=>'1010','d'=>'100','e'=>'0',
  'f'=>'0010','g'=>'110','h'=>'0000','i'=>'00','j'=>'0111',
  'k'=>'101','l'=>'0100','m'=>'11','n'=>'10', 'o'=>'111',
  'p'=>'0110','q'=>'1101','r'=>'010','s'=>'000','t'=>'1',
  'u'=>'001','v'=>'0001','w'=>'011','x'=>'1001','y'=>'1011',
  'z'=>'1100', '0'=>'11111','1'=>'01111','2'=>'00111',
  '3'=>'00011','4'=>'00001','5'=>'00000','6'=>'10000',
  '7'=>'11000','8'=>'11100','9'=>'11110','.'=>'010101',
  ','=>'110011','/'=>'10010','-'=>'10001','~'=>'01010',
  '?'=>'001100','@'=>'00101');

需要注意的是，如果你特别在意内存占用的话，上面的代码可以解释为位（bit）。给每个代码增加一个开始位，就可以形成一个位的模式，每个字符就可以用一个字节来储存。同时，当解析最终编码的时候，要删除开始位左边的位（bit），从而获得真正的变长编码。

尽管许多人没有意识到，事实上“时间间隔”是定义莫斯代码的主要因素，所以理解这一点是生成莫斯代码的关键。所以，我们要做的第一件事，就是定义莫斯代码的内部码（即“嘀”和“嗒”）的时间间隔。为了方便起见，我们定义一个“嘀”的声音长度为一个时间单位dt，“嘀”和“嗒”之间的间隔也是一个时间单位dt；定义一个“嗒”的长度为3个dt，字符（letters）之间的间隔也是3个dt；定义单词（words）之间的间隔是7个dt。所以，总结起来，我们的时间间隔表就像下面这样：

PHP实现基于文本的摩斯电码生成器

在莫斯代码中，编码声音的“播放速度”通常用单词数/分钟(wpm) 来表示。由于英文单词有不同的长度，而且字符也有不同数量的“嘀”和“嗒”，所以，从wpm转化成（音频）数字采样并不是看上去那样简单。在一份被国际组织采用的方案中，采用5个字符作为单词的平均长度，同时，一个数字或标点符号被当做2个字符。这样，平均一个单词就是50个时间单位dt。这样，如果你指定了wpm，那么我们总的播放时间就是 50 * wpm的时间单位/分钟，每个“嘀”（即一个时间单位dt）的长度等于1.2/wpm秒。这样，给出一个“嘀”的时间长度，其他元素的时间长度很容易就能够计算出来。

你可能已经注意到，在上面显示的网页中，对于低于15wpm的选项，我们使用了“farnsworth spacing”。那么这个“farnsworth spacing”又是个什么鬼？

当报务员学习用耳朵来解码莫斯代码的时候，他就会意识到，当播放速度变化的时候，字符出现的节奏也会跟着变化。当播放速度低于10wpm的时候，他能够从容的识别“嘀”和“嗒”，并且知道发送的哪个字符。但是当播放速度超过10wpm的时候，报务员的识别就会出错，他识别出来的字符会多于实际的“嘀”和“嗒”。当一个学习的时候习惯低速莫斯代码的人，在处理高速播放代码的时候，就会出现问题。因为节奏变了，他潜意识的识别就会出错。

为了解决这个问题，“farnsworth spacing”就被发明出来了。本质上来讲，字母和符号的播放速度依然采取高于15wpm的速度，同时，通过在字符之间插入更多的空格，来使整体的播放速度降低。这样，报务员就能够以一个合理的速度和节奏来识别每个字符，一旦所有的字符都学习完毕，就可以增加速度，而接收员只需要加快识别字符的速度就可以了。本质上来说，“farnsworth spacing”这个技巧解决了节奏变化这个问题，使接收员能够快速学习。

所以，在整个系统中，对于更低的播放速度，都统一成15wpm。相对应的，一个“嘀”的长度是0.08秒，但是字符之间和单词之间的间隔就不再是3个dit或者7个dit，而是进行的调整以适应整体速度。

生成声音

在php代码中，一个字符（即前面数组的索引）代表一组由“嘀”、“嗒”和空白间隔组成的莫斯声音。我们用数字采样来组成音频序列，并且将其写入到文件中，同时加上适当的头信息来将其定义成wave格式。

生成声音的代码其实相当简单，你可以在项目中php文件中找到它们。我发现定义一个“数字振荡器”相当方便。每调用一次osc()，它就会返回一个从正玄波产生的定时采样。运用声音采样和声频规范，生成wave格式的音频已经足够了。在产生的正玄波中的-1到+1之间是被移动和调整过的，这样声音的字节数据可以用0到255来表示，同时128表示零振幅。

同时，在生成声音方面我们还要考虑另外一个问题。一般来讲，我们是通过正玄波的开关来生成莫斯代码。但是你直接这样来做的话，就会发现你生成的信号会占用非常大的带宽。所以，通常无线电设备会对其加以修正，以减少带宽占用。

在我们的项目中，也会做这样的修正，只不过是用数字的方式。既然我们已经知道了一个最小声音样本“嘀”的时间长度，那么，可以证明，最小带宽的声幅发生在长度等于“嘀”的正玄波半周期。事实上，我们使用低通滤波器（low pass filter）来过滤音频信号也能达到同样的效果。不过，既然我们已经知道所有的信号字符，我们直接简单的过滤一下每一个字符信号就可以了。

生成“嘀”、“嗒”和空白信号的php代码就像下面这样：

while ($dt < $dittime) {
 $x = osc();
 if ($dt < (0.5*$dittime)) {
 // generate the rising part of a dit and dah up to half the dit-time
 $x = $x*sin((m_pi/2.0)*$dt/(0.5*$dittime));
 $ditstr .= chr(floor(120*$x+128));
 $dahstr .= chr(floor(120*$x+128));
 }
 else if ($dt > (0.5*$dittime)) {
 // for a dah, the second part of the dit-time is constant amplitude
 $dahstr .= chr(floor(120*$x+128));
 // for a dit, the second half decays with a sine shape
 $x = $x*sin((m_pi/2.0)*($dittime-$dt)/(0.5*$dittime));
 $ditstr .= chr(floor(120*$x+128));
 }
 else {
 $ditstr .= chr(floor(120*$x+128));
 $dahstr .= chr(floor(120*$x+128));
 }
 // a space has an amplitude of 0 shifted to 128
 $spcstr .= chr(128);
 $dt += $sampledt;
 }
// at this point the dit sound has been generated
// for another dit-time unit the dah sound has a constant amplitude
$dt = 0;
while ($dt < $dittime) {
 $x = osc();
 $dahstr .= chr(floor(120*$x+128));
 $dt += $sampledt;
 }
// finally during the 3rd dit-time, the dah sound must be completed
// and decay during the final half dit-time
$dt = 0;
while ($dt < $dittime) {
 $x = osc();
 if ($dt > (0.5*$dittime)) {
 $x = $x*sin((m_pi/2.0)*($dittime-$dt)/(0.5*$dittime));
 $dahstr .= chr(floor(120*$x+128));
 }
 else {
 $dahstr .= chr(floor(120*$x+128));
 }
 $dt += $sampledt;
 }

wave格式的文件

wave是一种通用的音频格式。从最简单的形式来看，wave文件通过在头部包含一个整数序列来表示指定采样率的音频振幅。关于wave文件的详细信息请查看这里audio file format specifications website。对于产生莫斯代码，我们并不需要用到wave格式的所有参数选项，仅仅需要一个8位的单声道就可以了，所以，so easy。需要注意的是，多字节数据需要采用低位优先（little-endian）的字节顺序。wave文件使用一种由叫做“块（chunks）”的记录组成的riff格式。

wave文件由一个ascii标识符riff开始，紧跟着一个4字节的“块”，然后是一个包含ascii字符wave的头信息，最后是定义格式的数据和声音数据。

在我们的程序中，第一个“块”包含了一个格式说明符，它由ascii字符fmt和一个4倍字节的“块”。在这里，由于我使用的是普通脉冲编码调制（plain vanilla pcm）格式，所以每个“块”都是16字节。然后，我们还需要这些数据：声道数、声音采样/秒、平均字节/秒、一个区块（block）对齐指示器、位（bit）/声音采样。另外，由于我们不需要高质量立体声，我们只采用单声道，我们使用 11050采样/秒（标准的cd质量音频的采样率是 44200采样/秒）的采样率来生成声音，并且用8位（bit）保存。

最后，真实的音频数据储存在接下来的“块”中。其中包含ascii字符data，一个4字节的“块”，最后是由字节序列（因为我们采用的是8位(bit)/采样）组成的真实音频数据。

在程序中，由8位音频振幅序列组成的声音保存在变量$soundstr中。一旦音频数据生成完毕，就可以计算出所有的“块”大小，然后就可以把它们合并在一起写入磁盘文件中。下面的代码展示了如何生成头信息和音频“块”。需要注意的是，$riffstr表示riff头，$fmtstr表示“块”格式，$soundstr表示音频数据“块”。

$riffstr = 'riff'.$nsizestr.'wave';
$x = samplerate;
$sampratestr = '';
for ($i=0; $i<4; $i++) {
 $sampratestr .= chr($x % 256);
 $x = floor($x/256);
 }
$fmtstr = 'fmt '.chr(16).chr(0).chr(0).chr(0).chr(1).chr(0).chr(1).chr(0)
   .$sampratestr.$sampratestr.chr(1).chr(0).chr(8).chr(0);
$x = $n;
$nsampstr = '';
for ($i=0; $i<4; $i++) {
 $nsampstr .= chr($x % 256);
 $x = floor($x/256);
 }
$soundstr = 'data'.$nsampstr.$soundstr;

总结和评论

我们的文本莫斯代码生成器目前看起来还不错。当然，我们还可以对它做很多的修改和完善，比如使用其他字符集、直接从文件中读取文本、生成压缩音频等等。因为我们这个项目的目的是使其能够在网络上方便的使用，所以我们这个简单的方案，已经达到我们的目的了。

当然，一如既往的，希望大家对这些简单粗暴的代码提出建议。

上一篇：中国十大火锅品牌企业排名（现在全国最火的火锅连锁）

下一篇： jsp 导出文件实例代码

PHP实现基于文本的摩斯电码生成器

PHP基于openssl实现的非对称加密操作示例

php 实现简单的登录功能示例【基于thinkPHP框架】

基于递归实现的php树形菜单代码

PHP基于imagick扩展实现合成图片的两种方法【附imagick扩展下载】

PHP实现的超长文本分页显示功能示例

PHP实现的无限分类类库定义与用法示例【基于thinkPHP】

基于PHP+Mysql简单实现了图书购物车系统的实例详解

基于PHP+mysql实现新闻发布系统的开发

PHP利用pdo_odbc实现连接数据库示例【基于ThinkPHP5.1搭建的项目】

php基于socket实现SMTP发送邮件的方法