Google发布Gemini Robotics-ER 1.6,机器人可读取仪表

【时间地点】
2026年4月14日,Google DeepMind发布Gemini Robotics-ER 1.6模型,这是其推理优先机器人模型的重大升级。

【核心功能】
新模型专门针对机器人应用的关键推理能力进行优化,包括:
- 视觉和空间理解
- 任务规划
- 成功检测

最重要的是,新模型解锁了一项新能力:**仪器读取**(Instrument Reading)。机器人现在可以读取复杂的压力表和液位计,这是通过与Boston Dynamics合作发现的用例。

【技术突破】
Gemini Robotics-ER 1.6在空间和物理推理能力方面显著提升,包括:
- 指向(Pointing):精确对象检测和计数
- 关系逻辑:识别最小物品、定义"从-到"关系
- 运动推理:映射轨迹和识别最佳抓取点
- 约束合规:处理复杂提示如"指向所有可以放入蓝色杯子的小物体"

【应用场景】
该模型可与Boston Dynamics的Spot机器人配合使用,让机器狗能够读取设施中的各种仪表,进行巡检和监控任务。这为工业自动化开辟了新的可能性。

【开发者可用】
从今天起,开发者可以通过Gemini API和Google AI Studio使用Gemini Robotics-ER 1.6。Google还提供了开发者Colab笔记本,包含配置示例和提示示例。

【参考来源】
- Google DeepMind Blog: https://deepmind.google/blog/gemini-robotics-er-1-6/
- Gemini API Documentation: https://ai.google.dev/gemini-api/docs/robotics-overview
- Developer Colab: https://github.com/google-gemini/robotics-samples