在全球制造业与建筑业面临劳动力短缺的背景下,重型设备的自动化成为关键议题。初创公司Bedrock Robotics近日宣布与AWS生成式AI创新中心达成合作,共同利用视觉语言模型解决自动驾驶系统开发中的核心挑战——海量视频数据的自动化标注。
传统方法中,训练施工自动化系统需要人工对数以百万小时计的监控视频进行逐帧标注,以识别铲斗、挂钩及各类作业任务,这一过程成本高昂且效率低下。通过与AWS的合作,Bedrock Robotics团队引入了基于Amazon Bedrock平台的视觉语言模型技术。该技术允许开发者通过自然语言指令,让AI自动识别并描述视频中复杂的工地场景,实现了“AI标注AI”的新模式。
据报道,在工地环境中,由于拍摄角度特殊、粉尘干扰等因素,普通模型对施工工具的识别准确率一度较低。经过针对性的提示工程优化后,系统的识别准确率得到了显著提升。这一进步将原本依赖人工的繁琐数据筛选过程,转化为自动化、可扩展的数据处理流水线,极大加速了自动化系统的训练周期。
目前,该技术已集成于Bedrock Operator设备改造方案中,旨在使普通挖掘机具备高精度的操作能力。这一合作案例不仅展示了AI在处理物理世界复杂视觉数据方面的强大潜力,也为正面临“用工荒”的建筑、物流及农业等领域,提供了一个可行的自动化升级路径与参考模板。


