GeoAgent是一种能够进行精细地理定位推理的人工智能模型。该研究旨在解决以往基于强化学习的方法在性能和可解释性上虽取得突破,但仍因依赖AI生成的思维链数据及与地理特征冲突的训练策略而存在局限的问题。
为此,研究团队首先引入了GeoSeek,这是一个由地理专家和专业玩家共同标注思维链数据的新地理定位数据集。团队进一步深入探索了地理任务的内在特性,提出了由地理相似性奖励和一致性智能体评估的一致性奖励来辅助训练。这种设计鼓励模型从地理视角向正确答案收敛,同时确保其推理过程的完整性与一致性。
实验结果表明,GeoAgent在多个粒度上超越了现有方法及一系列通用视觉语言大模型,并且其生成的推理过程与人类的思维逻辑高度吻合。该模型展现了通过强化地理特征学习来提升无处不在的地理定位能力的潜力。


