2025-06-23

VLN-R1は、大規模視覚言語モデルを活用し、自然言語指示で連続的なナビゲーションを実現するフレームワークです。データセットと独自の学習手法で効率的に性能を向上させました。