ロボットのマルチモーダル学習の課題を解決するため、MultiGenフレームワークを提案。物理シミュレーターに大規模生成モデルを統合し、視覚と音声のシミュレーションを実現。これにより、現実のロボットデータなしで効