2025-07-18

最近の研究で、情報豊富なフレーム選択がVideo-LLMsの性能を向上させると判明。VideoITGはユーザー指示に基づくフレームサンプリングを提案し、VidThinkerで自動注釈を行う。40K動画データセッ