人工智能技术的智能程度如何?这是与其平台上存储密度和容量有绝对正比的关系,这是今天上午9点,笔者参加IBM在北京举行了主题为“天工开物,人机同行”的2017 IBM中国论坛最大的收获。 人工智能技术尚无统一定义标准 火了两年的人工智能这一话题热度目前依然在上升,尽管升级于IT行业,但今天不论任何行业任何公司在讨论未来发展时都只会强调人工智能技术的重要性。但人工智能技术的衡量标准是什么?各家都在说自己的人工智能技术比其他家好,但如果没有统一的对比标准,这种好又从何而来? 人工智能技术离不开大数据 人工智能技术离不开大数据,而说到数据就不得不提到结构化数据和非结构化数据。结构化数据比较简单,如果用数据模型来表示就是二维表(Excel表格就是典型的二维表)。而非结构化数据则比较复杂,数据模型也种类繁多,比如树形结构图。 非结构化数据对技术要求极高 举个简单例子,苹果。苹果的产地,价格,重量等这些可以量化的数据都可以很清晰直观的存储在数据库中,这就是结构化数据。那么味道该如何存储呢?甜?酸?多甜?多酸?这些数据并不直接对应某种属性,因此需要多种方式来进行解释,也正因为如此造成数据存储量大幅上升,而这也给人工智能技术带来极大的挑战。 存储密度与容量决定人工智能技术程度 以IBM的Watson(沃森)认知系统为例,其中最为重要的就是通过神经网络、深度学习等多种技术让机器尽量像人类一样去理解非结构化数据,而若要实现这一切,首先需要拥有海量的数据来帮助机器判断,毕竟在机器的世界中只有简单的0和1,而若想实现最终的“智能”目标还需要一个从量变引发质变的过程,这对数据存储技术有了新的要求。 以医疗行业数据为例,2011年的医疗健康数据量是 150 exabytes(EB), 1EB换算成我们常用的TB单位则是1024*1024=1048576 TB。而据数据分析机构预测,到了2020年,每73天医疗数据量就会翻一翻。据陈黎明介绍按照目前使用的存储技术,每150万个原子才能存储一个比特(bit)的数据,而今年2月IBM在《自然》学术期刊上发表的研究成果已可实现在单个原子上存储1比特数据。直观量化来说就是一枚硬币大小的硬盘可以存下iTunes里的2600万首歌曲,大幅缩小体积所带来的好处显而易见,除了可以节省大量存储成本外,最为重要的就是更多的数据将为机器提供更多的参考实例,让机器像模仿人类思考方向更进一步。 本次大会上IBM大中华区董事长陈黎明、IBM全球高级副总裁Bruno Di leo等来自IBM的十余位高管携手5位分别来自金融、营销、法律、医药、材料、智能硬件领域的公司高管分享了关于人工智能技术,云计算以及物联网目前的技术发展状况和相关应用案例。 |