第两千三百九十九章 让研究浪漫起来 (第1/2页)
搞完这些又花了近一个小时,周至也就懒得回卧室了,按照老习惯,朝座位边的大卧榻上一倒完事儿。
接下来的两天里,周至带着麦小苗开始熟悉甲骨缀合项目和数字图书馆的图数据库架构。
这两个项目也是接下来会契合细胞类神经网络实验研究的重点。
甲骨缀合项目最早源于瀚文大字库图片字转矢量字的自动识别技术,以及字根解构与拼合技术,这两个子项目的成功,也给瀚文大字库的研发节约了大量的时间,尤其是二期与三期项目,几乎是拿到两位老师兄《字海》的卡片后,在极短的时间内就完成了识别,输入,矢量化,入库等工作。
也由于二期字库的极快丰富,直接封杀了港岛、新岛、湾岛甚至岛国等汉字使用区想要自主研发全码字库的可能,吸引了日韩两国派遣工作组来“共襄盛举”,最终让瀚文大字库成为了全球唯一且统一的汉语言字符大字库。
这些技术当然不会在完成大字库研发后就束之高阁,而是继续深化发展,很快周至又给它们找到了应用场景,那就是甲骨缀合。
于是之前的两个技术,也就发展成了边缘识别契合算法和变化字根通合算法。
这两个算法说起来倒是简单,就是实现部分人眼和人脑的功能。
前一个算法就是不管图片上的碎片是大是小,位置如何,角度如何,也能够让计算机识别出其边缘特征,并且将之与数据库当中其余碎片的边缘特征进行匹配,如果找到匹配得上的位置,就会尝试进行甲骨的拼合。
拼合好之后的甲骨,上面的文字往往就从寥寥几个不明含义的散字变成一段话,很多隐藏在碎片当中的历史信息就会第一次呈现在研究者们的面前。
价值当然不言而喻。
而第二个算法就更加的离散和非线性了。
甲骨文字虽然已经十分成熟,但是其流行的历史时间相当长,且组字的时候并没有固定的结构,因此往往一个字,多达数十种写法。
比如步,其实就是一个左脚和一个右脚的字根,这两个字根的写法就有很多种,有繁有简,而这两个字根被贞人将之刻到甲骨上组合成“步”字以后,其位置关系和角度关系可谓五花八门。
对于经过训练的人类来说,这两个字根只要刻得大差不差,脑子当中很自然地就会冒出这种概念:这个是左脚,这个是右脚。
然后只要两个字根摆放在一起,大致上下交错就行,脑子就会自然而然地冒出另一个概念:嗯,这大概率是一个“步”字。
但是这样的思维活动,对于目前的计算机技术来讲,就显得过于的“高级”了,因为现在的计算机技术,主要还在处理线性逻辑运算阶段,而对于这类一个输入多个输出,或者多个输出共同导致一个输入的复杂非线性关系,还难以处理。
麦小苗研究的学科,就是用来解决这个问题的。
往大了说,这就是人工智能的方向,往小了说,这就是让计算机解决非线性问题的初级尝试。
(本章未完,请点击下一页继续阅读)