首页 / 财经 / 正文

100:0,“阿尔法元”完爆“阿尔法狗”,人工智能又进化了

原标题:100:0,“阿尔法元”完爆“阿尔法狗”,人工智能又进化了

这世界,没地方说理去,还没搞懂阿尔法狗的原理,阿尔法元又横空出世了。

10月19日凌晨,国际学术期刊《自然》(Nature)指出,谷歌新智能“阿尔法元”:从0开始自学,在无任何人类指导的条件下,自学围棋,并以100:0的战绩击败“前辈”---阿尔法狗。

阿尔法狗,完全是一个打不倒的励志小强。

自出生就一路坎坷,最终借助48个TPU(神经网络训练专用芯片),参考了海量人类棋谱,并自我对弈3000万盘,又经数月训练,最终封神,以4:1大败韩国九段棋手李世石、以3比0战胜人类最强棋手中国的柯洁。

阿尔法元,完全是一个天才富二代。

仅用4个TPU,完全不屌人类经验,闭门自我训练3天,自已和自己玩了490万盘棋,出关后,以100:0的战绩轻松完爆阿尔法狗。

这说明什么?

说明人工智能在短短的时间内又向前进化了。

这张图是阿尔法元的训练时间轴

阿尔法元为什么这么强?

他采用了新的算法——强化学习算法。也就是说,在每一次训练后,他都能得到经验和教训,并以此优化算法、强化武功。

举个例子吧,假如你是一只猴子,生下来被放在一个没有猴子的岛上。

你这个时候也不知道吃什么东西适合自己活下来。

第一天,你试着吃蘑菇,结果吃到了毒蘑菇,死翘翘了,于是,你知道了,蘑菇不能吃。

第二天,你试着吃虫子,结果跑肚拉稀了,于是,你又知道了,虫子也不能吃。

第三天,你试着吃水果,结果精力旺盛喜刷刷,于是,你这回知道了,要靠吃水果才能在这个岛上活得倍爽。

阿尔法元,这只猴子自己和自己玩,相当于活了490万天,如果你可以活100年,他的经验相当于经历了1300个生命轮回,这经验积累的太吓人了,不是,是太吓猴了。

我是一个穷人,买不起TPU,甚至都无法免费查询最新的论文。

这些都是因为商业的原因,被保密了起来,用金钱加了锁。

我们中国,在这个方面是吃过大亏的。

鸦片战争时,大清并不是没有先进的火器。

比如,那个时候的八旗军队就已经配备了和洋人一样的燧发枪,但派去打仗的却是只配备了鸟铳的绿营军,因为,不想让汉人掌握最新的武器,结果被人家一直打到了京城。

当时的中国还引入了爆破弹(开花炮弹),可是因为保密,连林则徐都不知道有这么厉害的东西可以和洋人交手。

开始学习人工智能,我才知道还要到网上去租GPU,看来未来还要租TPU。

人类的科技一直在风驰电掣地向前,我们落后,有的时候,不是它太快了,而是它太贵了。

责任编辑: