CLIPとLMMsは、訓練データでよく表現される概念に対して高い精度を示すが、概念の組み合わせが精度に与える影響は不明確。研究では、単語の共起統計がCLIPの性能に影響を与えることを示し、共起頻度が精度に大きく