计算机视觉软件需要硬件,Xailient 和芯片制造商的联合创新正在加速向边缘 AI 的转变。
英特尔 Movidius™ 是 AI 硬件创新领域的领先者之一,正在改变计算机视觉和人工智能 (AI) 的未来。他们为边缘上的 AI 助手、无人机、机器人、相机、虚拟现实和增强现实以及许多其他设备带来了新的智能水平。一个应用示例是 面向视障人士的 AI 驱动的背包,帮助他们导航周围环境。
这款 AI 驱动的背包是使用 OpenCV 的人工智能套件(带有深度 OAK-D)构建的,由英特尔提供支持。它包括一个由 Luxonis 生产的 OAK-D 空间 AI 相机、一个主机计算单元、一个口袋大小的电池组和一个蓝牙耳机,用于提供实时警报和附近障碍物的近似位置。[11]
随着此类边缘设备对基于深度学习的 AI 的高需求,英特尔正致力于优化其处理器以推断机器学习模型,这导致了 Myriad 视觉处理单元 (VPU) 的诞生。
Myriad 视觉处理单元 (VPU) 是一款针对卷积神经网络 (CNN) 加速视觉计算的 AI 优化芯片。据英特尔称,Myriad VPU 具有专用的体系结构,可用于高质量图像处理、计算机视觉和深度神经网络,使其适合驱动现代智能设备中以视觉为中心的各种任务。[5]
在本博文中,我们将介绍英特尔 Movidius Myriad 2 和英特尔 Movidius Myriad X,并比较公开可用的预训练人脸检测器模型(MobileNetSSDV2 人脸检测器 和 零售人脸检测器)以及 Xailient Detectum™ 人脸检测器 在这两个系统上的性能。
英特尔 Movidius Myriad 2
Movidius Myriad X VPU(来源:英特尔公司) Movidius(英特尔公司)的 Myriad 2(来源:DJI)(图像来源)
Movidius(英特尔公司)的 Myriad 2 是一款视觉处理单元 (VPU),它提供低功耗、高性能的视觉处理解决方案,适用于各种目标应用,包括嵌入式深度神经网络、姿态估计、3D 深度感知、视觉惯性里程计和手势/眼球跟踪。[3]
英特尔使用这款相同的芯片创建了 Movidius 神经计算棒 (NCS),这是一种采用标准 USB 3.0 棒式外形的模块化人工智能 (AI) 加速器。这种 AI 加速器易于使用,可以直接连接到边缘设备(如树莓派)。通过在您的现有边缘设备上使用英特尔 Movidius NCS,您可以在设备上部署基于深度学习的应用程序并获得实时推断。[2]
在 Xailient,我们通过将英特尔 Movidius NCS1 连接到树莓派 3B+ 并运行两种不同的人脸检测器(MobileNetSSDV2 人脸检测器 和 Xailient Detectum 人脸检测器)来进行实验,以比较其性能。
在树莓派 3B+ 上的英特尔 Movidius NCS1 上运行 MobileNetSSDV2 人脸检测器时,我们观察到推理速度为 5 FPS。在运行 Xailient Detectum 人脸检测器时,推理速度提高了 14.8 倍。
MobileNetSSDV2 人脸检测器 | 近距离多人脸检测(边界框) | |
推理速度 | 5 FPS | 74 FPS |
大小 | 70 MB | 88 KB |
英特尔 Movidius Myriad X
英特尔 Movidius VPU 的最新版本是 Myriad X,它是首款采用神经计算引擎的 VPU,这是一种专用的深度神经网络推断硬件加速器。
神经计算引擎结合 16 个强大的 SHAVE 内核和高吞吐量智能内存结构,使英特尔 Movidius Myriad X 成为设备上深度神经网络和计算机视觉应用的理想选择。[1]
我们想要比较 Myriad X 与 Myriad 2 的性能,因此我们拿到了 OAK 设备(OpenCV AI 工具包),它由 Myriad X 芯片提供支持。
我们观察到,在使用 Xailient 近距离人脸检测器时,干扰加速了 3 倍;在使用 Xailient 远距离人脸检测器时,速度提高了 1.2 倍。
零售人脸检测器 | Xailient Detectum 近距离多人脸检测(边界框) | |
推理速度 | 54 FPS(4 个 SHAVE,4 个 CMX) 32 FPS(1 个 SHAVE,1 个 CMX) | 117 FPS(4 个 SHAVE,4 个 CMX) 90 FPS(1 个 SHAVE,1 个 CMX) |
大小 | 1.3 MB | 88 KB |
OAK 板的最大 FPS 速度为 120FPS。在本实验中,我们使用仅 4 个 SHAVE 就达到了此限制。
以高于 45 FPS 的速度运行 CV 价值有限。但这说明的是,由于 Xailient 的 Detectum 非常高效,因此我们留下了大量额外的容量,可用于运行其他模型或处理 Detectum 识别的感兴趣区域。
汇总表
英特尔 Movidius 神经计算棒 (NCS) 1 | 英特尔 Movidius 神经计算棒 (NCS) 1 | OpenCV AI 工具包 (OAK) | OpenCV AI 工具包 (OAK) | |
MobileNetSSDV2 人脸检测器 | Xailient Detectum 近距离多人脸检测(边界框) | 零售人脸检测器 | Xailient Detectum 近距离多人脸检测(边界框) | |
推理速度 | 5 FPS | 74 FPS | 54 FPS(4 个 SHAVE,4 个 CMX) 32 FPS(1 个 SHAVE,1 个 CMX) | 117 FPS(4 个 SHAVE,4 个 CMX) 90 FPS(1 个 SHAVE,1 个 CMX) |
大小 | 70 MB | 88 KB | 1.3 MB | 88 KB |
Xailient 和 Myriad X 在这次竞赛中获胜,推理加速至 117 FPS。英特尔 Movidius NCS1 到 Myriad X 的硬件更新在我们测试中表现出色,零售人脸检测器速度提高了 5 倍,Xailient 的软件速度提高了 1.6 倍,超过了之前的硬件。
Xailient 和 Movidius 的结合将为边缘实时计算机视觉带来更强大的功能。
需要在边缘上进行高计算能力的计算机视觉的其他用例是
- 人员检测
- 人脸识别
- 人员计数
- 汽车检测
- 行人检测
- 目标跟踪
- 手势检测和识别
- 车牌检测和识别
Xailient Detectum SDK for Intel Movidius 可供部分客户使用。
请与 Ray Edwards 联系:[email protected] 以了解更多信息。
参考资料
- https://www.intel.com/content/www/us/en/products/details/processors/movidius-vpu/movidius-myriad-x.html
- https://youtu.be/sRYs0dZLXkw
- https://newsroom.intel.com/press-kits/movidius/#gs.y3nsas
- https://newsroom.intel.com/wp-content/uploads/sites/11/2017/07/movidius-neural-compute-stick-product-brief.pdf
- https://thenewstack.io/a-closer-look-at-intel-movidius-neural-compute-stick/
- https://www.aaeon.com/en/ai/ai-solutions-powered-by-intel-myriad-x
- https://www.intel.com/content/dam/www/public/us/en/documents/product-briefs/myriad-x-product-brief.pdf
- https://store.opencv.ai/products/oak-d
- https://opencv.ac.cn/introducing-oak-spatial-ai-powered-by-opencv/
- https://newsroom.intel.com/news/intel-movidius-myriad-2-vpu-enables-advanced-computer-vision-deep-learning-features-ultra-compact-dji-spark-drone/#gs.yqhdam
- https://www.reviewgeek.com/75082/this-intel-driven-ai-backpack-helps-vision-impaired-users-avoid-obstacles/