第八十九章 备受关注(求收藏、推荐)

说来说去,最重要的就是语言库的建立。

这方面系统也为方远想好了办法,就是通过爬虫的办法,通过对短视频网站、直播网站、自媒体网站等进行数据获取。

当然这个过程并不是短时间内可以完成的。

而且对计算机配置的要求非常高,方远现在用的x星人电脑根本就支持不了这个软件的需求。

好在上次去“九州”公司的时候,他听到刘志军说道公司目前还有几台服务器暂时是空余的!

这也省了方远很大的功夫。

拿起电话,向刘志军说明情况后,这几台服务器的使用权就暂时交给了方远。

实际上,对于汉语的翻译是所有翻译软件头疼的事情。

经过五千年历史的沉淀,汉语的语意是所有语言中最复杂的情况。

特别是现在非常火的东北话,里面有很多词的对应词库是非常难以建立的。

这里就不得不感慨系统的厉害之处了!

在整段程序中,语意匹配算法是方远最喜欢的地方。

这里通过一个数学模型,建立文字和语意匹配模型。

所有字都相当于一个模型,一句话中有多少个文字,就相当于多少个模型相连接。

这样,只需要对每个模型进行处理,就可以得到这个字在这段话中的意思。

说起来复杂,实际上就是把每个字的所有意思都关联起来,然后词库中找到对应的意思即可。

接下来的工作,方远就不着急了,经过了axm大赛的锻炼,他在编程方面的进步是肉眼可见的。

他把写好的爬虫程序投放了出去,然后建立好与服务器的连接。

接下来只需要等待,等待收集的数据可以支撑起语言库的建立。

那个时候,就是完成这款软件的时刻。

除了这方面的工作,方远现在最重要的是改善这款智能软件的学习算法。

这可不是一件简单的事情,通过和qoqo的学习算法进行比较。

方远发现这款软件的学习算法需要改进的地方还真不少。

如果一一改进下来,还不如重新写一个算法省事呢!

说易行难,看着并不麻烦的事情,却让方远花费最多的时间来完成。