第(3/3)页 伊利亚兴奋地搓手。 “太好了,明天我们就可以开始真正的模型训练了。”伊利亚迫不及待。 在这些顶级实验室里,枯燥的调试和争论每天都在上演。 大家都在为了提高百分之一的正确率而不断尝试。 大卫又一次把键盘推开。 “我又失败了。这次的模型直接陷入了局部最优解,出不来了。”大卫揉着太阳穴。 约翰走过来拍了拍大卫的后背。 “去睡一觉吧,大卫。你的大脑需要重启了。”约翰建议。 大卫站起身。 “我觉得代码没问题,肯定是参数给的不对。明天我把学习率调小一点再试。”大卫嘀咕着离开实验室。 第二天,亚历克斯拆开显卡的包装盒。 “终于到了。这做工,看着就很能算。”亚历克斯拿起显卡端详。 伊利亚拿来螺丝刀。 “赶紧装到服务器上。我已经把驱动程序下载好了。”伊利亚催促。 两人合力把显卡安装好,开机测试。 屏幕上顺利显示出四张显卡的信息。 “完美识别。现在开始分配显存。”亚历克斯在终端里输入指令。 辛顿站在一旁看着他们操作。 “注意散热,别把实验室点着了。”辛顿半开玩笑地提醒。 伊利亚启动了训练程序。 终端窗口开始疯狂滚动数字。 “速度快了好多倍!这在以前简直不敢想象!”伊利亚盯着屏幕上的时间预估,大声喊道。 亚历克斯也露出满意的笑容。 “这就是并行计算的魅力。老黄这次算是做了一件大好事。”亚历克斯调侃。 大家各自守在电脑前,紧盯着自己团队的进度。 麻省理工的队伍决定放弃支持向量机,开始研究新的分类器。 东京大学的团队在经历了三次语法错误后,终于编译成功了第一版底层逻辑。 印度团队利用全校的闲散算力,终于用了一个月时间,下完了全部的一百多万张图片。 第(3/3)页