了更多的认识和理解。
他的目光落在了那行加粗的英文上,底下记录着他写上去的中文译文:
“信息的完整性并不依赖于展开后的广度,而取决于维度的深度。就像一个二维流形,可以通过弯曲、折叠,无损地嵌入到高维空间中。”
余弦盯着这句话,他的脑子里好像有什么东西被串联起来了。
就像是手边那张用来做笔记的A4白纸,这是一张完整的二维平面,上面密密麻麻地写满了他推导的公式。
如果我们生活在这个二维的纸面上,这张纸就是我们的整个世界,上面的每个字、每个符号,就是我们在这个世界上留下的信息,也就是所谓的“人格数据”。
如果不撕破这张纸,那么无论我们如何弯曲它,它的性质都是不变的,信息也不会丢失。
余弦思考着,如果把这张写满字的A4纸,攥在手心里,用力揉成一团。
那么这张原本可以铺满半个桌面的纸,就会变成一个紧实的、满是褶皱的纸球。
如果再用力些,它的体积还会被继续压缩,缩小了几倍、十几倍,甚至可以变成一个握在掌心里的“点”。
它变小了。
从一个占据大面积二维平面的物体,变成了一个小小的三维球体。
但是——
上面的字消失了吗?
没有。
信息丢失了吗?
也没有。
那些公式、单词、笔迹,依然完好无损地附着在纸面上,它们只是被“弯曲”了,被“折叠”、“挤压”进了纸球内部那些复杂的褶皱里。
在这个状态下,你看不到完整的信息,只能看到一些破碎的笔画和凌乱的线条。
但只要你懂得“展开”的规则,只要你小心翼翼地把它抚平,所有的信息都会原封不动地复现,一个“字节”都不会少。
这就是“高维拓扑流形”。
纸张,这样一个二维的流形,被折叠进了三维的空间,变成了一个纸球。
余弦感觉自己呼吸急促了起来,他想到了那天在咖啡馆里,温晓对着他说的话:
“你知道人脑有多复杂吗?千亿级的神经元,实时动态变化的生物电化学反应。要把这些东西向量化,哪怕是现在最强大的计算机,也存不下一个人完整的数据。”
“计算机里,文字能转化为向量,是因为文字本就是离散的符号,是有限的。但人,人是连续的,是混沌的。如果你要强行把一个人‘向量化’,那就意味着你要丢掉99.99%的信息,只保留几个干巴巴的标签,那样的话,我们就变成跟游戏里的NPC一样了。”
存不下。
这是当时温晓给出的,基于现有计算机科学逻辑的死刑判决。
因为在目前的线性存储逻辑里,要把一个人完整的“数字化和向量化”,需要的数据量是天文数字,是现在的硬件根本无法承载的。
但是......
如果父母的思路,从一开始就不是“压缩”呢?
余弦死死盯着论文上的那句话,一股寒意顺着脊背袭上心头。
从信息论的角度来看,通常的数据压缩,是有“损耗”的,就像是苏老先生在读书分享会上提到的,把一张RAW高清格式的图片,压缩成JPG,信息被丢弃了,画质下降了,那是为了节省空间而做出的妥协。
但父母论文里提出来的“映射和存储”,可能从根本上,就不是这种逻辑。
他们不想丢掉那99.99%的信息。
他们想做的,是一种......“折叠”。
就像是把这张A4纸揉成球一样。
他们是不是想通过某种手段,把一个人庞大、复杂、浩如烟海的记忆、情感、性格数据,全部“揉”在一起,折叠进一个更高维度的数学模型里?
在低维视角,比如我们现在的现实世界或者计算机世界里看来,那个被处理后的东西,可能只是一个很小的“数据包”,一个简单的“向量”,甚至只是一个坐标点。
就像这个纸球,在远处看,也只是一个白点而已。
但实际上,那个小小的“点”里,却折叠着一个完整的灵魂,一段完整的人生。
当需要的时候,只要有合适的“解压工具”,或者说,只要提供一个能够让它“展开”的空间。
这张纸就能被重新铺平。
这个被折叠的“灵魂”,就能在瞬间被“释放”出来。
那些被折叠起来的记忆、感情、性格,就会重新显现出来。
完好无损,鲜活如初。
“存储......”
余弦喃喃自语,头皮发麻。
这个猜想太大胆、太疯狂了。
如果这是真的,那意味着,父母当年研究的,根本不是什么大模型向量化。
他们是在研究一种......
“灵魂容器”的制作方法。
这哪里是科学论文?这分明是一本关于如何把活人装进缸子里的说明书。
“余弦?你没事吧?”
杨依依从电脑屏幕后面探出头,有些担忧地看着他。
“你......是哪里不舒服吗?要不要休息休息?”
“没......没事。”
他没有把这个猜想告诉杨依依。
太疯狂了。
这也太超出常人的认知了。
而且,如果这个猜想是真的,那么他父母的车祸,可能就不仅仅是因为动了谁的蛋糕那么简单了。
他们可能是触碰到了某种......“禁区”
第41章 “灵魂容器”-->>(第2/3页),请点击下一页继续阅读。