在NVIDIA GTC 的第二日,由Google 负责深度学习领域的资深科学家暨工程师Jeff Dean 进行主题演说, Google 是相当早就投入机器学习以及深度学习领域的企业,投入的原因也是为了使其服务更好,同时设法认知使用者行为并能进行应对;然而若是以传统的人工智慧难以应付瞬息万变的使用者行为,故具有永续学习进化能力的深度学习也成了Google 的首选。
在 Google 的服务,产生相当膨大的数据量,而这些数据也成了所谓的大数据基数,但该如何有效的应用这些数据,解析数据就成了相当重要的一环。以图像为例,如何帮数据库中海量的照片分类?该如何将一张复杂的照片中分析出照片内的元素?抑或是文字中的语意分析与解析,这些就需要仰赖基于深度学习的识别系统。
基于80 年代推出的神经网路架构的深度学习,是解决Google 烦恼的手段,将事物逐层拆分并解析,并从中归类出特征,并以大量的参考资料中进行自主的学习,最终模仿人类的感知历程,产生一套自我学习认知平台。就是深度学习的目标,而为了达到此目标,结合具庞大运算核心与处理能力的 GPU 是使其理论得以突破的关键。
深度学习基于神经网路系统,所谓的神经网路的终极目标,就是如同人的神经一样,需要具备相当迅速的分辨与联想能力,且如同人的思考逻辑一样,它需要具备自主学习以及并行处理的能力,所以深度学习的神经网路架构是透过将学习内容进行拆解、并逐层分析特征,再从大量的样本中产生一套判断逻辑,所以深度学习就像人类一样可藉由提供大量的参考素材后持续提升精准度,且深度学习后的系统,不仅能够进行照片物体分析、语音辨识、翻译,甚至可为一张照片进行注解与叙述。
以深度学习来说,不同于传统的影像辨识需要针对条件撰写大量且复杂的条件,只要给予参考素材后,就可自主建立判断方式,例如给予大量的人像照片后,它会自行产生一个做为判断照片中是否是人像的参考资讯;抑或是猫的照片,给予系统各种不同花色的猫照片蓝本,它也能创造出一个用于判断分析照片中是否有猫的基础影像。像是现在 Youtube 的自动标签产生系统,也是基于深度学习的成果。
且深度感知是相当进阶的一种人工智慧技术,它不光只是给予应对与反应,而是能够像人类一样做出联想与判断;项是在文字与语言的使用与解析,基于深度学习的系统能从一开始只能判断依循完整文法的字句,慢慢能够判断倒装句、了解同义词。用于语意分析也脱离不了由关键字串拆解开始,随着学习过程,系统将能更精确地抓出关键字词,同时还可进行互动的对话叙述。
先前许多深度学习的范例都是用在比较生硬的图片、文字语意解析;然而 Jeff Dean 最后举了一个有趣的深度学习的应用,就是让神经网路系统学着玩 Atari 的游戏。听起来好像很简单,理论上只要撰写一套逻辑,让系统设法得分就好,不过光是这样其实并不足以称为具进化能力的深度学习。
他们只告诉系统如何移动角色,有哪些按键,怎样算是得分,怎样会Game Over ,接着就把系统连上游戏,让系统学着去玩这些经典游戏;像是刚开始玩太空侵略者的时候,在前几轮笨笨的发射子弹也不闪躲,但接着开始知道原来可以闪子弹,到最后知道该如何有效率的移动且快速的通关。
像是敲砖块也是,一开始把球发出去,系统就不会动放着让球掉下去,但经过一百次的试玩后,系统开始知道要追着球跑不要让球掉下去,当累积到五百次游玩后,系统不仅抓到诀窍,还知道可以藉由把球沿着缝隙弹到上方轻松的快速得分。
深度学习的目的不光只是一套对应问题的应对的方式,而是经由不断反覆的自主学习过程中,不仅使系统越来越精确,甚至还能够自己去发掘变化性,产生更有效率的处理方式。仿佛人类在学习认知的过程一样,由一开始的懵懵懂懂,到最后能够抓到诀窍一样。
想要观看完整影片的人可以从这里看呦~ https://www.ustream.tv/recorded/60071572
Follow 我们的Page,每天追踪科技新闻!
想看更多英文版文章吗? 点我进去~