人工智能(Artificial Intelligence)和深度学习(Deep Learning)有望转变人类与世界互动以及企业运作的方式,从而使人们做出更明智的决策,而英特尔技术正在实现这场变革。 全球最大的云服务提供商之一微软利用英特尔人工智能技术来运行复杂的深度学习模型,这些模型实现了从智能手机上的人脸识别技术和语音识别再到自动驾驶等等的各种使用。 微软选择了英特尔Stratix 10 FPGA作为其新的深度学习加速平台(代号为Project Brainwave)的关键硬件加速器。这种基于FPGA的深度学习加速平台可以提供“实时人工智能”技术,使云基础设施能够以超低延迟来尽可能快速地处理和传输数据。在云中,系统需要处理直播数据流(包括视频,传感器或搜索查询)并快速将数据传送回用户。因此,提供实时人工智能变得越来越重要。 Stratix 10 FPGA 和 SoC FPGA 通过采用英特尔FPGA的Project Brainwave平台,微软以“前所未有”的高性能灵活处理了极具挑战性的深度学习模型。在2017年高效能芯片大会(Hot Chips 2017)上,微软展示了基于FPGA的深度学习平台,和半导体技术领域中的最新成就。微软是第一家在其公有云基础设施中部署FPGA的大型云服务提供商,而其通过英特尔Stratix 10 FPGA实现的技术进步加速了深度神经网络(DNN),这种网络可以通过概念相似的方式复制人类大脑的“思维”。 相比于为运行单个工作负载而优化的专用深度学习硬件加速器,英特尔FPGA的高度灵活性让用户可以自定义硬件以满足特定的工作负载需要,并可以随着深度学习工作负载和运用模式的更改而快速地重新配置硬件。英特尔Stratix 10 FPGA结合了硬化处理器模块,这种模块可提供高水平的连续性能和效率,并可根据用户的自定义来灵活的编程。 许多硅人工智能加速器现在需要将多个请求分组(称为“批处理”)以实现高性能。微软的Project Brainwave平台利用英特尔Stratix 10技术,在单个请求上展示了超过每秒39万亿次浮点运算的性能,在云中确立了实时人工智能计算的新标准。Stratix 10 FPGA为实时人工智能计算确立了新的云性能标准,具有创纪录性的低延迟、高性能以及无需批量处理人工智能请求的多种特点。 通过加速模型训练、快速评分和高度可扩展的基础设施,基于英特尔技术的机器学习平台将数据转化为可操作的商业智能。结合最新的英特尔至强可扩展处理器,英特尔FPGA可自定义和编程以提供低延迟和灵活的精度,与单独的英特尔至强处理器相比,在深度学习推理方面每瓦特功耗具有更高的性能。 |
发表评论