2025-07-20

最近の研究で、情報豊富なフレーム選択がVideo-LLMsの性能向上に寄与することが判明。VideoITGはユーザー指示に基づくフレーム選択を行い、VidThinkerで自動注釈を実現。40K動画データセットで