经费做到出来。在这个过程中,我想要让大家看这个图,只不过不是拍脑袋说道做到一个芯片,就做到一个芯片,背后有它背后的逻辑。所以你看图里面,老鼠的,这里面小老鼠、大老鼠、猫、猴子、人脑都能看到,这是什么东西?这是在超级计算机上做到建模,一开始的时候,在做到芯片之前,都是IBM的超级计算机速度较为慢,所以超强算上在算数,在建模这个大脑,当然建模的程度,就像刚才说道的,有可能神经元的模型不那么细致,但是沿着这样一条路线在做到建模,所以做到了十年,到最后我要做到芯片,为什么必需做到一个芯片?是这样的,当时2007年,为了申请人这个项目的时候,这个项目叫SyNAPSE,大家告诉这是神经元的意思,但是实质上是简写,一个神经形态的自适应的、可塑性、可前端可拓展的电子系统,这么罗嗦的一句话说到底就是一个电子大脑皮层,在2007年立项的时候,而立的目标就是像人脑皮层一样,做到这么一个电子构建,电子构建功能一千瓦。上面那个电子的一千瓦,下面人脑20瓦,单位面积内的神经神经元、神经元的数是一样的,所以体积就一样,是两升。
媒体那边谈2014年谈的话,实质上谈的是2007年申请人这个项目的时候,以定的一个目标。从2008年开始做到,也给了不少钱,最后把这个芯片做到出来。为什么要做到这个芯片?只不过是因为靠超级计算机仿真,是不有可能解决问题大脑的这种传导规模的建模。
IBM用的模型,大家看见是立体模型,是最简单的一种,当然比我们人工神经网络用的MP模型要简单一点,就是比较简单的一种脉冲神经网络的模型。即便用这种非常简单的模型,他们在2009年,超强算上的一篇,当时那个系统叫皮层模拟器软件,那个时候按照他们的估计,这个数是公开发表的,大家看,那时候做到的是83分之1,人要1秒,它要83秒,仿效了4.5%的人脑,消耗了144T的内存,0.5pflops的计算出来量,折算一下,如果用天河二号,要把人脑规模动态的,不多达几十赫兹的信息处理能力算数出来的话,必须300台天河二号,神威天湖之光,也必须100台。所以电费就过于,当然我们也没用上那么多超算,尽管我们是第一,我们只有一台神威,要造100台神威,才能用一个修改的模型,把人脑建模出来。
所以这就是我一开始说道的,你用这个做到研究的可以往下做到,真为要做人脑规模,不是一条不切实际的路。中国再行有钱人,也无法为了仿效建模大脑,建100台神威天河。所以一定要做到硬件,根据神经网络的必须做到新的硬件,能迫近人脑这样一个终极目标。
这是TureNorth芯片,这个芯片上的神经网络,显然是脉冲神经网络,但是做到了很多的修改,这里面也有一些较为创意的东西。比如一个神经元要跟几千个神经元通讯,怎么通讯?人脑是演化好了,相连都早已有专门的神经纤维在联成,很多就是神经纤维,不一定是我们的神经元。物理相连早已演化出来了,一个芯片怎么做?所以一个芯片内,任何一个神经元都有可能跟其他几千个神经元串联,比如就设计了一个高速路由系统,芯片内的高速路由系统,使得最后当然期望刚才说道的,每秒钟比如一个神经元放几十个脉冲,它都能动态送来过去,类似于这样,从芯片设计的技术上展开解决问题。
这个早已构建了,把大量的芯片制成版,把大量的版拼在一起,做到一个装置,是期望它能像人脑一样的某种程度的信息处理能力,这是一个。然后就是欧洲的几个项目,其中蓝脑计划我刚才说道过了,是欧洲大脑计划很最重要的一个推动力。Spinnaker是刚才说道的英国系统,英国这个系统是用AARM做到的,这个实质上是去年的,去年这个系统是50万核,50万个ARM核,建模400M神经元和400B神经神经元的一个系统。
五个机柜具备这样一个基础能力。转动的轮胎是什么东西?就是体系结构,在建构的就是说大家想要还是刚才那样一个问题,一个神经元要跟几千个其他的神经元通讯,通讯是中间很关键一个问题,要速度,所谓的速度就是在这个地方,你能无法很高效的构建给定一个神经元跟几千个神经元通讯,一旦设计一个,有效地的结构,一个体系结构,因为像IBM的芯片是偏内的,高速的结构,Spinnaker每一个单元就是一个ARM的核,一个ARM处理器,处理器有64还是多少个核,这个核之间,每一个核去建模神经元的话,要通讯,所以怎么解决问题通讯协议,这是它的一个专利。
论文里面也都有报导,所以这样一个的环,这些核之间连接成蜂窝状,最后构成这样一个形状,每个白点就是它要升空神经脉冲了,向周边传送下去。当然每一个神经元,你不有可能连几千个,但是能已完成把这个信号传送过去,是它的独有地方。所以现在在欧洲这两台机器,早已对外服务了,大家也可以采访,然后我现在有一个神经计算的模型,我想要用你的,可以用,但是会给你对外开放那么多基本资源,实验一下还是可以做到的。
还有一个,刚才说道神经元现在大家早已实在没什么好担忧的了,因为神经元的数量,是神经神经元数量的千分之一,所以确实大脑的简单,物理构成结构是怎么把神经神经元做到出来。在找寻新的物理材料,结构新的器件,最有代表性的一种叫忆阻器,这个器件本身最初的设想,不是为了做到神经形态计算出来的,是我们一个华人的科学家明确提出来一个点子,物理上有电阻、电容、电感,他是数学家,他说道这个不极致,应当有第四种,他其了名字叫忆阻器。
第四种是根据电流的变化不会转变的组织的一种器件,当时只是一个数学上的一个概念。但是在2008年的时候,寻找了这种材料,具备这种特性。
而这种特性,一方面可以转变的组织,可以做到存储,迅速你找到,它只不过跟生物神经元的可塑性是类似于的,所以后来就把它,很多人研究这种器件来做到神经神经元。过去这些年,大约十来年神经元早已很热了,很多学校和单位在做到神经元。这种神经元,我大约给大家形象的叙述一下,将来怎么做是这样的。
这篇论文就是1971年明确提出来,这是2014年参与指导一个博士后写出的一篇论文《大脑是由忆阻器构成的》,大脑的这些百万亿神经元,是可以用忆阻器来构建。当然这么一图,不是电路,怎么构建电路,实质上就是看这个图。
实质上神经元的构建,是电流生产的工艺来说,只不过并不简单。是这样,我们刚才说道过神经元的数量要很少,相对于神经元来说是很少,所以神经元不会在两边,一排神经元又一排神经元,关键是怎么把神经元用物理的相连连接起来。所以这两排神经元,横竖的两排神经元,先涂上一种材料,用现在光刻的手段,刻一道道线,最后绿点部分就是一个一个,认同不是圆的,你刻什么形态,就是什么形态,那个形状不最重要,那个材料就可以,因为那个蓝线相等于相连神经元的树突和周突,那个蓝的部分就是那一层材料,可以根据得出结论树突上的信号传送,发生变化,就像神经神经元一样的再次发生连接起来,强度不会发生变化。
所以用这样一种物理材料,生产将来的电路,是没问题的。当然这种材料的稳定性,是不是能,首先从数学上,模型上是可以迫近生物的,但是稳定性、可靠性,还是要有更加多的研究。这个方面我刚才说道,国外有很多单位在做到,国内也有很多单位在做到,比如说北大、清华、南大、华中科大,都有很多的组织再行做到,所以有十几年的研究历史,这个就是我们打一个想象的比方,就是新一代计算机的晶体管,晶体管就是刚才说道的谁再行做到出来,谁能做到的较为靠谱,确实变为未来产业的粮食,那就是未来的一个很根本性的贡献,中国还是无法领先的。
所以就是刚才说道的,这样一些系统、器件,甚至于刚才日本的火蝇全脑网络都所画出来了,这样一些标志性的事件,我们说道去年我们可以在人类的历史上,只不过计算机正在转入一个新的纪元。这方面中国当然要做到,所以前那么两三年,我常常四处去说道,我们一定得做到这个东西,当然北京市也给了不少反对,国家显然在布局。
现在来看,我们中国早已转入了发展这样一些,较慢发展的过程。所以这是7月20日,新一代人工智能国务院放的总体发展规划里面一张总图,在网上可以iTunes规划规划上没图,国务院发文件会带上插画,不是教科书。实质上这张图原本在里面,只是放的时候,替换成了。除了我们说道的人工智能我不进行,类脑智能理论、量子智能理论、高级机器学习只不过都在里面,在国家未来十几年的发展过程中,这些东西都会作为很最重要的内容展开反对。
所以我们应当早已转入了,关于前面这一段,也有一些国际上的总结,大家今年的2月份,神经形态计算出来这一部分,我是写出的科普第三篇,大家通过计算机学会的第二期和公众号多有,大家不愿看的,可以再行看一下。我刚才谈的这些东西都是国内外的进展,都不是我这个实验室做到的,我们下面谈的,是实验室做到的一些东西,跟视觉涉及的。五、AI睁开眼睛我们习以为常的视频概念是24帧图像,倒数构成一种倒数的感觉,计算机视觉也是基于视频的。
但是事实上这个事跟生物视觉距离很近。电影需要产生倒数影像,是因为生物视觉有一个视觉暂留的现象。
生物视觉拒绝接受真实世界的性刺激,根本都是一个倒数过程。类脑视觉像现在每秒钟输出30帧图像,每帧图像就像现在做到的,传达每帧图像这个方向去做到。这个路子本身就是错的,生物本来没有这样做到,没说道一幅图像, 两幅、三幅图像,根据图像看差异然后还要分析这个光流,不是这样的。
生物系统根本获得的都是在最细的力度上,它的一个动态的连发狂过程。我们常常假设大脑信息处理的模型很简单,实质上这种复杂性,有时候是自己给自己的一种假问题。
在1978年的时候,美国科研院士明确提出来,只不过大脑皮层处置信息的机制是一样的,我们处置视觉、处置听力、处置触觉,所有的在大脑皮层里面作为一种信息处理的算法,用计算机的算法,或者明确模型是一样的。但是对我们来说,视觉、听力触觉是不一样的,你看到、你听到和你手毛巾这个感觉是不一样的,但是大脑皮层拒绝接受的都是一样,都是信号。在感觉这样一类,我们的智能上面,还有一些新的数据,要跟大家共享。一个是究竟我们人作为一个生物体,我们感官世界,我们的结构,所有的智能归根到底某种程度是某种结构构建的,某种程度是某种物质的载体去构建它的。
对于感官来说,我们总共有300万根神经,感官神经就是眼睛、耳朵、触觉,刚才所有的这种感官,总共有300多万根。其中每个眼睛背后有100多万根,两只眼睛200多万根,只剩的听力、味觉、触觉、全身的皮肤,你能感觉到热、冻、毛巾,各种的感觉总共100多万根。眼睛为什么是心灵之窗?因为入口占到了三分之二。
所以我们信息的提供,靠眼睛提供了三分之二的信息量。如果我们的盲人,眼睛不拒绝接受信号了,视觉就没用了,没性刺激了,就该怎么办怎么办?听力或者其他的感觉,就不会利用那个皮层。所以盲人的手的脆弱程度很高,因为那个视觉的中心部分还是做到了触觉的处置、听力的处置。
所以他的耳朵很魂魄,之所以很魂魄,是因为更好的皮层用来做到听力了。这也一定程度上说明了刚才那个原理,皮层还是那个皮层,还拒绝接受有所不同的性刺激,做到有所不同感官的任务。背后的基理应当是一样的,但是这个基理究竟是什么?这个事现在并没模型,比如像刚才说道的,我们的眼睛拒绝接受光,光转化成斯挂科,转化成神经脉冲,通过每个眼睛100万根神经纤维,送往V1,V1在后脑勺。
究竟我们当然就想要告诉,神经系统是怎么来传达和编码这个信息,这是视觉信息处理的基本问题。但是光视觉系统消耗的能耗就是大脑的十分之一。所以睁开眼睛是花上能量的,不是睁开眼睛说瞎话。
睁开眼睛,你一天不吃的饭为眼睛和视觉消耗掉了。所以有的时候,大家要闭目养神,别让眼睛杨家在那睁着,赫尔一会儿,别在这转化成光、电,传达什么了。闭目养神知道能养神,因为你省了十分之一的能量嘛。那究竟这个眼睛从拒绝接受光性刺激仍然到最后,比如辨识出有物体,甚至作出于动作,过程的这些细节,当然这是生物视觉他们在研究,我就不一一去说道了。
我们想要说什么呢?究竟这个生物视觉系统,怎么来回应信息的?类脑计算出来,大脑可以做到的东西很多,感官是其中的一部分,但是这一部分很最重要,它是入口,入口怎么传达信息,我们都不告诉的话,后面的很多工作很难积极开展。我们北京市的反对下,想要在这方面有所进展。
2010年的那篇论文谈的,一般来说我们传统上指出这个眼睛就像一个非常简单的滤波器的样子,对图像展开滤波处置。实质上,事实上我们的眼睛做到的事情比我们想象的要多的多。大家看这个论文的题目是《眼睛比科学家们坚信的还要聪慧》,实质上传达的信息的方法,意味著不是一个非常简单的摄像头。
所以大家比如说现在热门的无人驾驶,用一个摄像头把自动驾驶解决问题了,显然做到的很不俗。但是我们驾车的时候,我们这个生物摄像头,能力实质上是相比之下优于我们今天的摄像头的。
所以怎么把这个生物的摄像头这些智慧能用上,当然想要生产背后的原理。他们能得出之前,还是返回刚才说道的,现在告诉他我们一些基本的原理,但是又无法告诉他细致的定量的东西,那怎么办呢?在北京市的命令下,我们做到了一些工作,意味着是视觉系统最前面这一段,眼睛,视网膜到V1。另外一个实皮层,那个实质上就是V1,大脑的最初级的那个区域,必须定量中心在做到的,他们做到了一个模型。
但是这些都是在计算机上玩的,确实的生物的部分,是我们医学部的薄老师在做到,把猴子的视网膜摘下来,看它的神经网络结构。另外一个,是唐市明老师,长年累月,做到了很多年,他的精神像上午说道的,他不管这个,当然他也是结清,所以他也不生气说道要怎么样。很多年仔细观察猴子的皮层,拒绝接受光性刺激的时候不会再次发生什么。
这是一个把猴子的视网膜摘出来之后,他们做到的扫瞄,扫瞄完了之后,这一层就是视网膜中细致视觉那一块的神经网络,当然这个也是书面的原因,大约不能看见一个结构,一个大体的结构,一个环形的结构。那个一根一跟的纤维就是神经纤维,送来神经信号的主播。这是标记各种各样的细胞,有所不同的标记物,把它标记出来,然后把这个网络给表明出来。
然后再行去做到这个模型的更进一步数据化,模型化,最后把这个结构搞清楚。这个是刚才说道的,仔细观察皮层,偷偷地仔细观察这个皮层,这个是一个断层。从在猴子看见一个视觉性刺激的时候,从上到下一层一层的看哪些神经元派发的,哪个神经元和神经元之间,谁在传送信号,通过什么样的地下通道传送信号,就是做到这个事。
为了看这个东西,怎么看?你要关上它,不关上它怎么看,猴子背后实质上是关上的。但是大家不要担忧,关上是做到了手术,做到了麻醉,用半透明罩子老大它罩上。
所以把这一块骨头替换成一个半透明的玻璃,然后这个猴子再不生活再不不吃东西,该玩玩,但是做到实验的时候你就得椅子,该睡觉还是再不睡觉。就戴着上显微镜看它,让它看东西,看后面那个东西。外面看见的只不过就是这样的事情,这是一个陶乐天在做到,他从2004年就开始做到猴子视皮层的建模,也做到了几十年了,留给了一些现象。
时间关系,我就跳过去了。我们这个组等会儿给大家展示的是做到中央简化的建模,中央化建模。就是细致视觉这一块,我们为什么关心这一块?眼睛和刚才的视网膜很简单,所以确实把视网膜做到出来,最后大约必须最少五年的时间。
我们现在只是把其中的细致辨识,细致辨识对辨识信息编码,我刚才谈我们这个实验是是编解码国家工作实验室,所以最关心的是我们研究看的时候,看清楚了,让一个场景,是怎么变化的。周边对运动,对类似一些形态的检测,那些也要做到,但是是放到后面来做到。怎么来做到这个东西呢?就是回过头来,还是返回神经中去。
一个神经元宽什么样,它的形态,这是刚才说道的拆下猴子视网膜去扫瞄,把三维的数据扫瞄,一个一个辨识做到出来,所以它宽什么形态。第二个做到神经元的模型,就是上午说道的方程,另外这个方程早已可以刻画各种神经元的生命学不道德,但是刻画神经元不道德和每一种神经元,明确在再次发生什么,你的数学工具在那个地方,但是每种神经元有自己的特性,所以要调参数。调来调去,最近才能迫近给它一个电性刺激,它能产生一种什么样的脉冲模式。
这个参数调好了之后,就算这个神经元区分出来了。为了做到的细致,只不过一个神经元不是一组方程式,把这个分为很多段,所以每个里面,是一组方程组。
所以一个神经元的计算出来代价是很高的,大约刚才说道的一个CPU,最少一个核去算数一个神经元。朱铁军老师和其实验室的博士生随后对他们正在做到的视觉系统解析项目做到了展示。
本次课程为收费课程,2017年8月不会在AI慕课学院独家上线,原价 2500 元(CCF 会员)的线下课程现在限时特价 699 元预售,有兴趣的学员砍:http://www.mooc.ai/course/114,或者扫瞄右图二维码观赏。涉及文章:北大计算机系朱铁军CCF-ADL讲习班上篇:从计算机发展史介绍生产超强人工智能的立身——类脑计算出来马斯克说道的脑机融合还有多近?确实的脑机科技前沿告诉他你真凶 | CCF ADL 81类脑计算出来前沿班总结重磅讲座预告片:朱铁军、陈云霁等专家齐聚CCF ADL,共享类脑计算出来与深度自学处理器 | 开学甄选中原创文章,予以许可禁令刊登。下文闻刊登须知。
本文来源:必威·BETWAY体育-www.jcbxdc.com