「衬衫的价格是九镑十五便士」。当人类被问到根据该信息回答「衬衫多少钱」时,人脑是可以通过对句子进行结构分析——「价格」是主语、「衬衫」是表语、「是」是谓语、「九镑十五便士」是宾语,从而寻找到问题需要由宾语携带的信息来解答。
但AI(或者说深度学习算法)并不是这样工作的。它并不能真正「理解」句子的结构及其含义,而是将其转换为毫无意义的单元进行数学计算——衬-元素A、衫-元素B、……士-元素L,然后计算各元素之间的关联性(两个元素共同出现的「概率」)。在基于大量材料的类似计算下,算法会逐渐发现元素A(衬)和元素B(衫)一同出现的概率明显高于A与C、D……等一同出现的概率,于是算法认定两者存在关联,记为元素AB,整个句子于是被重新转换为更深层次的元素组合-AB(衬衫)、C(的)、DE(价格)……KL(便士),然后算法对新转换出的元素组合重复上面的概率计算(#过度简化警告)。最终,算法能够通过概率数字建立元素AB与元素GHIJKL之间的关联,于是为包含元素AB的问题返回元素GHIJKL。
↓
RT @madawei2699: #深度学习
@githubcopilot 的深度学习模型既可以生成代码,类似 @openai 的 GPT-3 一样也可以生成文本👇 这么看,深度学习的应用场景发展比元宇宙快多了?🤔