我们很高兴地宣布 OpenCV 空间 Al 竞赛 由英特尔赞助 结果。我们相信赢得比赛的人不仅是一些才华横溢的 Al 工程师,而且是引领世界变得更美好的开拓者。祝贺所有获奖者!
从众多优秀作品中选出最佳作品并非易事,因此我们决定在金奖、银奖和铜奖类别中分别选出两位获奖者。
我们的六位大奖得主
$3,000
通用手控
$3,000
$2,000
$2,000
居家锻炼助手
$1,000
自动割草机导航
$1,000
我们很高兴看到来自所有
人工智能和机器学习专家的众多投稿。我们很高兴向大家介绍参赛者提交的最佳项目,如下所示
视障人士视觉系统
团队:Jagadish Mahendran
使命
这里的重点是提供一个可靠的智能感知系统,以帮助盲人和视障人士使用 OAK-D 传感器在各种室内和室外环境中安全行走。
解决方案
在这个项目中,该团队为视障人士开发了一个全面的视觉系统,用于室内和室外导航,以及场景理解。开发的系统简单、时尚,并且不易被察觉为辅助设备。使用可以在低计算能力下运行的先进感知任务来解决常见的挑战,例如交通标志、悬挂障碍物、人行横道检测、移动障碍物和高程变化(例如楼梯检测、路缘进入/退出)以及定位。方便的用户友好的语音界面允许用户控制和与系统交互。经过在加州蒙罗维亚市中心及其周边地区进行数小时的测试后,我们相信该项目解决了视障人士面临的常见挑战。
"我要感谢 Daniel T. Barry 在整个项目中提供的帮助、支持和建议,感谢 Breean Cox 不断提供的宝贵意见、标记以及对视障人士面临的挑战进行教育,感谢我的妻子 Anita Nivedha 的鼓励,并与我一起不懈地收集数据集,帮助进行测试,"
作者笔记
项目动机
早在 2013 年,当我开始攻读人工智能硕士学位时,开发视觉辅助系统的想法就出现在我的脑海中。我甚至与一位教授分享了一个提议。当时使用智能传感器的不可行性,再加上深度学习技术和边缘 AI 在计算机视觉领域尚未普及,使得这个项目难以取得进展。过去 5 年,我一直是一名 AI 工程师。今年早些时候,当我遇到我的视障朋友 Breean Cox 时,我感到讽刺的是,当我一直在教机器人如何看时,还有很多人无法看到需要帮助。这更促使我构建视觉辅助系统。OpenCV 空间 AI 竞赛的时机再好不过了,它为我构建这个系统并将这个想法变为现实提供了完美的渠道。
注意:我们正在撰写一份更新的研究论文,其中将提供更多关于我们使命和我们创建的解决方案的见解,我们将在博客上尽快发布该论文。
通用手控
团队:Pierre Mangeot
使命
解决方案
目前,OAK-D 用作 RGBD 传感器,但模型在主机上运行。一旦 Gen2 管道可用,模型将能够在设备本身运行。有关 Gen2 管道的详细信息和状态,请关注下方给出的 GitHub 链接。
我们感谢 PINTO 的模型动物园存储库在开发这个项目中的帮助,该存储库帮助我们有效地调整了训练模型的结果。
包裹分类和尺寸测量
团队:Abhijeet Bhatikar、Daphne Tsatsoulis、Nils Heyman-Dewitte、William Diggin
使命
- 许多货运公司没有使用最新技术大规模准确测量货物。他们最多只描述货物的宽度、高度和深度。在许多情况下,会使用手动卷尺进行这些估计。
- 即使他们以更精细的级别测量货物,他们也总是将长方体放在不规则形状的物体上。例如,圆柱形桶的尺寸是适合该桶的最近的 3D 立方体(宽度 x 长度 x 高度)。
解决方案
该团队构建了一个端到端的概念验证,用于测量货物并将其装入集装箱。该解决方案利用 DepthAI USB3(OAK-D)相机来准确确定形状,然后计算货物运输包装的宽度、长度和高度。所有这些都可以由软件工具(3D 集装箱堆叠软件)管理,该工具根据集装箱的尺寸找到一批包装的最佳排列方式。
自动叉车的实时感知
团队:Kunal Tyagi、Kota Mogami、Francesco Savarese、Bhuvanchandra DV
使命
使用现代自动叉车的一个缺点是,由于在装卸货物时视野不佳,任何技术部件都可能发生故障。在很多情况下,自动叉车的技术故障将导致大量等待时间。
解决方案
该团队提出了一个绝妙的解决方案,即用于自动叉车的实时感知,这将有助于解决这个问题。它将增强先进传感器以及视觉和地理引导技术的性能。许多行业以外的人不知道,物流中的自动车辆已经承担了物流工作流程的重要部分。自动叉车在仓库区域装载、卸载和运输货物,通过相互连接形成灵活的输送带。因此,必须找到一种解决方案,可以提高自动叉车的整体性能,避免频繁故障,并使其以全部潜力发挥作用。
"特别感谢 Ayush Gaud、Luong Pham、Kousuke Yunoki 和 Yu Okamoto
帮助完成这个项目。"作者笔记
居家锻炼助手
团队:Daniel Rodrigues Perazzo、Gustavo Camargo Rocha Lima、
Natalia Souza Soares、Victor Gouveia de Menezes Lyra
使命
我们观察到,由于今年健身房和公共场所的关闭,在保持社交距离的同时进行体育活动成为一项挑战。然而,独自锻炼也可能很复杂甚至很危险,有时甚至会导致可能的肌肉损伤。
解决方案
该团队开发了一个家庭健身房系统运动分析 (MAHGS),以帮助用户在居家锻炼时进行锻炼。在这个解决方案中,它会估算人的 3D 人体姿势,并分析骨骼的运动,返回适当的反馈,以帮助用户正确地进行锻炼。
该系统由两个主要模块组成
- 3D 人体姿势估计 - 它使用 OAK-D 的神经推理功能和 DepthAI 库开发。人体姿势估计模块将运行在与 OAK-D 连接的 PC/树莓派 4 上,因为它还没有 Wi-Fi 或蓝牙。
- 运动分析 - 这是使用称为 Ikapp 的技术实现的。运动分析模块将在智能手机上运行,使用 TCP/IP 协议和 ZeroMQ 框架在这些设备之间进行通信。
自动割草机导航
团队:Jan Lukas Augustin
使命
- 杀死刺猬等小型动物。
- 伤害儿童、猫、狗等。
- 驶入土丘并撞击“未连接电线”的障碍物,如树木。
解决方案
- 在英特尔 Movidius Myriad X 上进行物体检测的神经推理和 4K RGB 摄像头。
- 基于单目摄像头进行视差/深度流的点云分类。
- 基于视差和校正后的右流的视差图像分类。
- 使用校正后的右流进行运动估计。
- 点云(用于异常值检测的椭圆包络线)
- 视差(支持向量机)
- 物体(用于物体检测的 Mobilenet-SSD)
我们感谢英特尔在边缘 AI 方面的技术领导地位以及对本次比赛的赞助。
OpenCV