FSD渐入佳境，视觉方案还在机器人中“打酱油”？

07-21 1430阅读

一边是技术圈顶流，一边在当前行业应用中没什么存在感。

优点缺点，两头拔尖

优点与缺点都突出的特点，让视觉方案一直伴随着争议，在近些年的行业应用上也一直透着“底气”不足。但随着在自动驾驶方面，纯视觉FSD开始表现出极其优秀的智驾能力，是否意味着，对于机器人导航方面，视觉方案也不仅仅是配角？

视觉方案的优势除却成本较低，更加重要的是能够获取更丰富的环境信息，让机器人在重定位、场景分类、交互等功能实现上更具优势。但缺陷也因为数据处理量巨大，对算力要求很高，在算法和硬件无法给予足够支持时，机器人就会出现精准度下降、卡顿、避障失灵等问题，进而导致任务无法达到预期，甚至失败。这意味着要发挥出视觉方案的实际潜力，要么搭载高算力平台，要么需要优化程度非常高的算法，否则所谓的巨大潜力，便成了笑话。

回到现实，让选择视觉的消费级扫地机器人产品重新拉高算力成本，显然不可能。但如果算力无法满足要求，算法就会做剪枝，阉割功能和极限性能，这也是视觉方案在当前行业应用上只能做配角的重要原因。

消费级的产品注定了其目前能搭载的芯片算力不会太高，想要真正发挥视觉方案的应用潜力，便只能在算法上下功夫。

算法瘦身，提升算力利用率

INDEMIND认为，对算法“瘦身”，并提高算力资源利用率，或许是打破算力桎梏的有效路径。为此，INDEMIND进行了多年的实践探索。

一方面，通过对算法进行轻量化“瘦身”，研发了轻量化VSLAM（基于深度学习特征的SLAM架构）、轻量化Depth（基于深度学习特征匹配的Depth）、轻量化深度学习模型（底层算子自研、剪枝、量化）等，在不影响功能表现的前提下，对算力要求有效降低。

另一方面，通过采用硬件加速技术，对于视觉处理采用NEON加速、GPU加速、DSP加速等方式，提升芯片算力利用率。（系统运行时，芯片的计算单元不会全部被使用，导致算力资源浪费。）

结果证明，通过全栈自研轻量化算法和应用一系列软硬件优化技术，INDEMIND实现了在几美金的计算平台上稳定运行整套VSLAM算法。

目前，公司推出的家用机器人AI解决方案搭载4核A53/A55级别芯片即可满足需求，能够适配如RK3566、VicoreTek 6601/6801等（全解决方案情况下，双目视觉多传感器融合SLAM、双目Depth、物体识别及整机完整SDK）。需要说明的是，现有的大部分视觉导航方案在算力上大多需要TX2及以上，甚至PC级算力需求，且对CPU、GPU或NPU、内存均有较高要求。

算法再升级，赋能产品“真”创新

· 打破现有建图惯例，首创“真”三维建图

目前主流的传统2D栅格地图、拓扑地图虽然能够描述环境中存在的障碍物几何特征及其环境结构信息，但却缺乏机器人用于理解环境、人机/物机交互等业务逻辑的高层次语义信息。

工程机演示，不代表最终量产效果标题

INDEMIND则基于自研的VSLAM技术，首创了市面上真正意义上的三维地图。地图构建过程中，能够重建物体及环境的结构信息，还有物体类别、功能属性等“常识”性信息，这为上层功能开发提供了底层数据支持。

· 厘米级精准避障技术，无惧玻璃、积木

与自动驾驶渐入佳境相反，机器人仍在与避障死磕。一块积木、一面玻璃等似乎成了大多数扫地机器人无法逾越的天堑。

INDEMIND基于设备端、云端智能决策平台、大数据平台三端专门建立了一套智能决策引擎，用于支持机器人完成逻辑判断和决策，且在不断使用中，能够根据关键数据不断更新算法模型，持续提升场景处理和问题应对能力。借助微秒级的智能决策引擎，机器人能够稳定检测各类障碍物，支持低矮障碍物避障（地插、桌椅底座等）；高反障碍物避障（玻璃、镜面等）。同时，配合环境补光技术，机器人在黑暗环境同样能够轻松应对。