第二百一十八章 场子必须找回

语言是由语音、词汇和语法构成。粤省存在的几种方言,均是华语的分支。只是方言不同于一般的语言,大多数的方言都没有文字,只有音。使用的文字仍然是华字。

这大抵是始皇帝的功劳吧,书同文车同轨。

要做出这种语音识别转换软件,首先要实现的是识别,第一步就是需要把方言识别出来。

然后就是意思转换,最后就是输出其他的方言。

思路确定,张凯接着就要把工作拆分。

语音识别功能,要实现识别就需要建立相对应的方言语音数据库。这样就可以根据输入的方言语音对比数据库资料,然后整理出相对应的意思。

意思的中介表达,张凯初定是华字。

输出的方言就可以根据华字意思来读取。当然说是如此,各种方言的表述方式也大为不同,需要调整的地方估计还不少。

张凯越想越觉得可行。

说干就干,张凯驱车离开办公室,直奔沙子区。

张凯打算先拿潮汕话与妖都语来试手,为什么呢?

因为潮汕话与妖都语这两种方言流传比较广,有很多的方言发音词典。

不得不说,这些人的作为让人颇为钦佩。

每种方言音都不少,就比如说妖都语就有8781个字汇。要把这个字全部准确读一遍,然后储存到数据库中,工作量也颇为巨大。

要一个一个地去读一遍,张凯总觉得效率低得不行。

智能播报这玩意已经出现很多年了,它的核心程序就是拼读。

如果把这个拼读程序用到这个方言输入中,那势必会大大减少张凯的工作量。

拼读程序最关键的部分是,拼读的逻辑。码程序对于张凯来说,不难。

但是要把拼读的逻辑写进去,那就头疼了。

最后张凯不得不去研究潮汕话字典和妖都话字典的发音符号。

幸好,字典的编撰者也考虑到了读音的便利,也考虑到了印刷问题,他们的读音都采用了国际音标。

所以张凯把两个字典研究了一轮,发音逻辑基本已经清晰。

为了方便,张凯直接把国际音标规规矩矩的读一遍,把这作为两种方言的发音基础。

然后设计拼读程序,把国际音标的发音逻辑输入到程序当中。

这里不得不赞小蓝,运算速度真心是吊炸天。