这都是过去带来的教训,今天当大数据和人工智能结合在一起的时候,我们还不知道它可能的危险,比如带有垄断性质的大公司利用手中的数据试图来控制社会,用于大规模战争,用于犯罪等。
下面我们从最基础的地方认识一下人工智能和大数据,只有知道基础,才有可能知道它能做什么不能做什么。
今天人工智能整个的大发展实际上是过去超过了半个世纪的发展积累出来的。首先,人工智能第一个重要的部分是算法,而这个算法的探索早在上世纪50年代就开始了。关于人工智能的提法、算法和想法,甚至一些指导性的意见,是很少几个创始人在1956年的时候在一次会上确定下来的,其中奠基人之一是经济学家西蒙教授,他是诺贝尔经济学奖获得者,同时他是卡内基梅伦大学的经济学教授、计算机教授、心理学教授,这三个专业统一在一起,才有了人工智能的想法。
人工智能的算法部分如今发展的最好的是所谓的“神经元模型”,神经元模型使机器可以在人的指导下进行学习,所谓“深度学习”就是今天通常人们讲人工智能时所提到的东西。人工智能的另外一个普遍使用和可探索的方法是“统计算法”,但是无论使用的是人工训练的办法还是统计的办法,都必须要大量的数据,这就是为什么大数据是基础。
人工智能的第二个基础是计算能力。在过去的半个世纪里,计算速度、计算能力和存储能力基本上是每两年提高一倍(摩尔定律),积累了半个世纪以后,现在超强的能力使得无论使用任何一种计算方法的人工智能,在一些领域,机器超过人,而且是大大地超过人,一部分是因为算法,一部分原因是因为计算能力。当然了,所有的基础是大数据。
下面我们需要理解一下大数据本身的技术基础是怎么回事,我们才能明白人工智能可以做什么不可以做什么。首先,大数据产生的基础是传感器、移动设备,是传感器和移动设备先检测到一些具体的数据,然后通过互联网和物联网把他们传送,然后集中起来,所谓的大数据的核心就在于收集、传输、储存和处理所有这些传感器和移动设备可以度量的数据。这是关键所在,人工智能可以做什么不可以做什么,是由这个决定的,即是不是可以度量。
另一层面的大数据,是利用历史上积累的大量文献,其中包括各个学科积累的文献,比如说图书馆里有文字的、有图的、有音乐的、有舞蹈的记录,这些全都可以转换为大数据供机器去学习、分析。