前面说到AI的反对者对于算法的人格化、主体化想象,是因为我看到不少反对者将AI称为。但其实,洗稿是相当依赖生物智能的行为——将「衬衫的价格是九镑十五便士」洗成「买件衬衣要花80元人民币」,需要行为人「理解」词语的含义、并寻找同义词替换。算法是不具备这样的理解能力的,它只能计算不同元素组合的概率,然后尝试用概率相似的其他组合替换,所以(在训练不足时)出现「衬衣重4千克」非常正常。

有个故事很适合用来解释这种差异——一位爸爸为了让孩子不来打搅自己随手从杂志上撕下印着世界地图的页然后撕成碎片让孩子拼,没想到孩子几分钟就拼完了——原来孩子发现纸的背面印着一位模特照片,孩子按照人形很快拼贴,翻过来就是复原的世界地图。
孩子完全不理解世界地图的概念、各个国家的相对位置等等,但祂通过「人像碎片」与「地图碎片」之间绑定的关联性完成了任务。实际上一切电子设备都是这样,它不可能理解任何你的点击、拖动、输入,而是将·全·部·信·息·转化为单纯的乘法与加法(),在底层以单纯的数学运算进行工作。
这也是为什么《万神殿》之类的文艺作品对「数字世界底层」的「图形化呈现」令人忍俊不禁。

#洗稿 #过度简化警告

Last updated 2 years ago

「衬衫的价格是九镑十五便士」。当人类被问到根据该信息回答「衬衫多少钱」时,人脑是可以通过对句子进行结构分析——「价格」是主语、「衬衫」是表语、「是」是谓语、「九镑十五便士」是宾语,从而寻找到问题需要由宾语携带的信息来解答。
但AI(或者说深度学习算法)并不是这样工作的。它并不能真正「理解」句子的结构及其含义,而是将其转换为毫无意义的单元进行数学计算——衬-元素A、衫-元素B、……士-元素L,然后计算各元素之间的关联性(两个元素共同出现的「概率」)。在基于大量材料的类似计算下,算法会逐渐发现元素A(衬)和元素B(衫)一同出现的概率明显高于A与C、D……等一同出现的概率,于是算法认定两者存在关联,记为元素AB,整个句子于是被重新转换为更深层次的元素组合-AB(衬衫)、C(的)、DE(价格)……KL(便士),然后算法对新转换出的元素组合重复上面的概率计算()。最终,算法能够通过概率数字建立元素AB与元素GHIJKL之间的关联,于是为包含元素AB的问题返回元素GHIJKL。

警告:此处按照我个人理解进行了大幅简化和调整,准确的 技术原理请自行检索

#过度简化警告 #过度简化 #深度学习

Last updated 2 years ago