距离我们上次发布文章已经几周了,但 OpenCV AI 竞赛 2021 的热度丝毫未减!这篇文章中我们将分享一些亮点,以及对这场全球竞赛中另外两支优秀团队的采访。
在这篇文章中,我们将分享与一些团队的简短问答,这些团队在 OpenCV AI 竞赛 2021 中使用 #OAK2021 标签在网上发布了有趣的内容。非常感谢 EyeCan 和 Clara 团队这次接受了我们的采访!如果您想让您的团队出现在这里,请通过 phil @ opencv.org 与我联系。如果您错过了之前发布的几期系列文章,这些文章展示了来自竞赛的团队和精彩视频,请返回阅读第 1 部分,第 2 部分 和 第 3 部分!
来自 #OAK2021 标签的一些亮点
很多团队都是第一次发布内容,我们非常高兴看到这一点!本次更新是我们迄今为止一次性看到最多新内容的更新。感谢大家的分享。
- Roc4t 团队对牛的跟踪和姿态估计
- Big Orange 机器人使用 SLAM 和 YOLO v4 将物品递送给指定房间中以姓名识别的特定人员
- Calgary Storm 团队使用 OAK-D 和 Jetson Nano 实时显示 3D 物体
- Kauda 团队展示了用于协作和工人安全的 Spatial MoveNet + Blaze Hands
- Cortic 团队展示了多个 OAK-D 协同工作以提供实时驾驶反馈
- Cortic 团队的魔镜概念,他们一直在忙碌!
- SHL Robotics 自行驾驶机器人及其 2D 导航标记 展示了语义分割
- Deepflow Tesseract 团队的四足农业机器人 获得了 OAK-D 机器人手臂
- Calcutta Devs 团队的实时瑜伽姿势识别和估计
- Getafe Musarañas 团队的多摄像头左右 + 彩色 + 深度
与 EyeCan 团队的问答
你们的项目是什么?简要描述一下你们的问题陈述和提出的解决方案
标记数据是当今调整基于 AI 的视觉系统的主要问题之一。eyecan.ai 正是解决这个问题的,它拥有一个已获得专利的解决方案,可以利用机器人完全自动地标记数据。然而,在这个挑战中,我们想知道是否可以使用简单的传送带利用物体的运动和 RGB-D 传感器来做到这一点,以便在没有人工干预的情况下生成用于训练目标检测器的标签。我们的解决方案基于 TrinocularStereo 网络,直接部署在 OAK 芯片上,以便获得在传送带上移动的物体的密集 3D 重建。通过 3D 重建,我们能够单独分割物体并生成标签(边界框和/或掩码),然后训练检测器来识别它们。由于 OAK 的实用性(体积小且光学器件通用),我们可以以动态的方式(随意移动它到场景中)使用这种类型的传感器,而不是传统的一次性固定且无法移动的工业相机。
你们的团队有有趣的“起源故事”吗?你们是怎么走到一起的?
我们是一支来自 eyecan.ai 和同一所大学的计算机视觉研究小组的团队。我们一直都在处理目标检测和立体视觉,在 OAK-D 中,我们找到了这两个世界的完美结合体!
你们是如何决定要解决什么问题的?
我们的问题来自市场需求。AI 的采用率很低,特别是在工业界,因为收集和标记数据的耗时长。虽然有许多初创公司在做数据标记,但工业界非常保守,不接受将图像公开给外部人员进行标注。另一个问题是,如果在数据标注循环中有人工参与,则时间会长得多,最终的系统肯定会包含错误,这会影响其性能。
#OAK2021 对你们来说最激动人心的部分是什么?
这个挑战让我们认识了一些很棒的计算机视觉团队和应用程序,这些是我们以前从未想到过的。看到许多团队在挑战期间开源了一些代码,尽管存在竞争,但仍然如此,这让我们非常鼓舞,这也促使我们效仿!
当你们得知自己入选第二阶段时,有什么想法或感受吗?
我们为入选感到非常自豪,因为这意味着我们的想法得到了认可,我们迫不及待地想要试用这款设备,因为我们知道很多公司都渴望拥有它,而不是我们 🙂
到目前为止,这场比赛有什么让你们感到意外的吗?
我们对其他团队的创造力和计算机视觉在几乎所有领域的应用感到非常惊讶
你们对其他参赛者有什么想说的话吗?
有太多团队值得获胜,我祝他们好运,对我们来说,真正的胜利是成为这个社区的一部分,并能够与之分享。
读者应该在哪里关注你们,以便更好地了解你们的进展?(推特、领英等)
在领英上:https://www.linkedin.com/company/eyecan-ai
与 Clara 团队的问答
你们的项目是什么?简要描述一下你们的问题陈述和提出的解决方案
我们的项目是为帮助演奏/学习特雷门的系统奠定基础。特雷门的困难之处在于,至少从初学者角度来看,它没有关于“音符”位置的任何物理反馈(与钢琴、吉他,甚至小提琴之类的弦乐器相比)。这使得很难找到放置手指的位置来发出音符。如果在 AI 的帮助下,我们可以得到关于如何演奏乐器的提示,那该多好。这就是计算机视觉进入我们项目和我们为比赛提出的想法的地方。我们发现,这比我们最初想象的要困难一些。
你们的团队有有趣的“起源故事”吗?你们是怎么走到一起的?
艾丽莎和我是多年的朋友。我们在大学里认识,但只是泛泛之交。几年后,我们再次相遇。她是职业音乐家,曾指挥乐队和合唱团,而我正是其中一个合唱团的成员。我不是音乐家,但我对计算机音乐的爱好将我们联系在一起。
你们是如何决定要解决什么问题的?
我们都对音乐感兴趣。艾丽莎是音乐家和音乐教育家。我对计算机音乐很感兴趣。特别是在我尝试了很多年后,我仍然无法弹钢琴,这让我一直很沮丧。起初,当我看到比赛公告时,我想到了我一直都在思考的一个想法。它关于使用计算机视觉来衡量钢琴学习者的表现(指法、动作、表现力等)。尽管如此,我进行了一些研究,发现这个问题对于一个为期 3 个月的比赛来说太难了。我原本打算放弃,但后来我想到了特雷门,我一直想尝试的一种乐器。这时,我告诉艾丽莎我的想法,我们一起设法改变了项目的范围和性质,并将其提交参赛。
#OAK2021 对你们来说最激动人心的部分是什么?
这让我有机会(和借口)更多地了解 OpenCV 库,学习如何使用 OAKD 设备,同时意识到它为爱好者打开了多少可能性。在比赛的过程中,我提出了一些想法,我想在比赛结束后进一步开发。我们正在学习一些 Supercollider(一个计算机音乐框架),我想要测试 OAKD 在声音设计中的用户界面实验。
当你们得知自己入选第二阶段时,有什么想法或感受吗?
这是我第一次听说 OpenCV 主办的比赛,我以前也没有为任何比赛提交过想法。所以我不知道结果会如何。我们能够进入第二阶段,这让我很惊讶。当我们的工具包到达时,我们很兴奋能赢得一些东西。
到目前为止,这场比赛有什么让你们感到意外的吗?
首先,这场比赛的参赛数量非常惊人。这表明 AI 和 CV 越来越受到关注,并为想要开始尝试的人群带来了动力。另一方面,我发现 CV 中的一些事情比最初想象的要难。这时,一个支持性社区(主要是通过 Discord 频道)对于培养一批强大的用户至关重要。我认为我们都在学习和尝试一些全新的东西,这真的很棒。
你们对其他参赛者有什么想说的话吗?
有时事情并不像预期的那样进行,你可能会花几个小时尝试调试或寻找解决方法。我的建议是:不要放弃。如果你卡住了,暂时停止思考这个项目,过一段时间你会发现自己有了新的想法。同时,发展那些与你个人兴趣和爱好相辅相成的想法。对我们来说,就是关于音乐和教育。
读者应该在哪里关注你,以便最好地了解你的进展?
- 有关进度的新闻,请关注我们的 https://instagram.com/stories/elisa.andrade.fernandez/ (我们很快就会发布)
- 项目源代码,目前位于 https://github.com/fortachong/clara
更多内容即将推出
感谢您阅读我们团队简介系列的第四篇文章。这些只是参加这场大型比赛的 200 多个团队中的一部分,我们祝他们一切顺利!如果您是希望加入这场酷炫活动的人工智能创作者,为什么不从 OpenCV 商店 购买一个 OAK-D 呢?
敬请关注更多简介,并在 Twitter 和 LinkedIn 上关注 #OAK2021 标签,以获取来自这些优秀团队的持续更新。别忘了 订阅 OpenCV 新闻稿 ,以便在发布新文章时收到通知,并获取来自我们合作伙伴的独家折扣和优惠。
下次再见!