别神话AI,它学东西比婴儿还笨,只是算得快
你让ChatGPT写首诗,它几秒就交卷;你让它解微积分,答案比标准答案还标准。你觉得它“聪明绝顶”。可你知道吗?它学一个概念,需要“读”几百万个例子,而你家孩子看两三张图片就能分清猫和狗。 人工智能的“学习”,跟你想象的完全不一样。今天咱们就扒开它的“黑盒子”,看看机器到底是怎么“学会”的。
一、计算机是“算得快”,但不是“懂”
电脑每秒能算上千亿次,一个人算一辈子都比不上它一秒。但它有个致命弱点:必须你告诉它每一步怎么做。比如排序一串数字,你要写清楚“比较两个数,如果左边大就交换位置,然后继续……”它才能执行。你没法说“把这堆数排好”,它听不懂。
更麻烦的是,很多对人类来说简单到不用动脑子的事,比如“认出猫”,你根本写不出规则。猫有白的、黑的、胖的、瘦的、睁眼的、闭眼的……从像素层面看,没有两张猫的照片是一样的。你没法用“如果……那么……”教会电脑认猫。
二、黑盒子:不知道里面怎么工作,但能干活
科学家想了个办法:不教规则了,让机器自己“悟”。我们造一个黑盒子,它里面是一大堆数学公式,可以把输入(比如一张图片)变成输出(比如“猫”)。一开始,这个黑盒子完全是瞎蒙。然后我们给它看大量“标准答案”——几百万张已经标好“猫”或“狗”的图片。黑盒子每看一张,就猜一次,猜错了就自己调整里面的公式,再猜,再调……如此反复几百万次,它慢慢学会了:只要图片里出现毛茸茸、尖耳朵、胡须……就输出“猫”。
展开剩余63%这个过程就叫机器学习。你问它“你怎么知道这是猫?”它答不上来,它只知道“根据我调整过的几亿个参数,这个结果最可能”。它像个顶级工匠,能做,但说不出道理。
三、神经网络:模仿大脑,但比大脑简单得多
这个“黑盒子”最常见的形式是人工神经网络。它模仿了动物大脑的神经元——一个神经元收到多个信号,如果总和超过某个阈值,它就向下一层发送信号。一层一层传递,最后输出结果。
最早的两层神经网络叫“感知机”,连“异或”问题(一个简单的逻辑运算)都解决不了,被嘲笑多年。后来科学家发现,只要在中间加一层“隐藏层”,三层网络就能模拟任何复杂的函数——理论上,给它足够多的神经元,它可以学会任何东西。这就是“万能逼近定理”。
但理论归理论,实际训练起来难如登天。一个几百万参数的神经网络,它的“误差曲面”是一个上亿维度的复杂地形。找最低点,就像在崇山峻岭里摸黑找最深的那条沟。科学家发明了“反向传播”、“随机梯度下降”等方法,让机器能高效地“下山”。
四、深度学习:层数越多,能力越强
如今,我们堆叠了几十层甚至上百层的神经网络,叫深度学习。每层神经元学习不同抽象级别的特征:第一层识别边缘、第二层识别形状、第三层识别眼睛……最后一层判断“这是猫”。为了处理不同任务,网络结构也进化出多种形态:卷积神经网络擅长看图片,循环神经网络擅长听语音,Transformer(也就是ChatGPT的核心)擅长理解上下文。
五、最大的尴尬:它还是黑盒子
虽然我们能看清神经网络里每一个神经元的数值,但看不懂这些数值组合起来到底代表了什么。就像一个几十亿行的程序,每一行都看得懂,但连在一起就看不懂了。这就是深度学习的“不可解释性”。在医疗、自动驾驶等需要“讲道理”的领域,这是致命缺陷。
六、总结:AI不是“超人”,是“机械记忆之王”
机器学习的本质,不是理解,是统计。 它通过海量数据,找到输入和输出之间的关联,然后套用在新的输入上。它没有意识,没有直觉,没有“举一反三”。你夸它聪明,它只是在做大量的矩阵乘法。但正是这种“笨办法”,加上人类设计的精巧结构和算力爆炸,造就了今天能写诗、能看病、能下棋的AI。
发布于:河北省