大视觉模型方向,计算机视觉顶尖期刊 IJCV 特刊征稿

Call for Papers

International Journal of Computer Vision (IJCV)

Special Issue on The Promises and Dangers of Large Vision Models

在过去十年里,深度学习彻底颠覆了计算机视觉领域,在许多视觉计算问题上带来了巨大的突破。最近我们观察到另一种趋势在社区里受到了广泛的关注和研究,即视觉模型的扩展,从长远来看可能会对该领域产生重大的影响。

具体来说,视觉模型的大小从几千万参数成倍增长到几亿,甚至几十亿,尤其是在 Vision Transformer 出现之后。此外,训练数据的规模和多样性也随着模型容量的增长而急剧增加,不仅表现在数量上,也表现在形式上(例如结合图像和语言)。在这里,为了简洁起见,我们将此类模型称为大视觉模型 (Large Vision Models or LVMs),其中包括单模态视觉模型和多模态视觉模型(例如视觉语言模型)。

一方面,从大规模数据中学习的 LVMs 在泛化方面表现出强大的能力:它们可以应对广泛的领域或场景,并且可以轻易适应多种视觉任务,例如图像分类 / 字幕 / 分割、对象 / 关键点检测和深度 / 表面法线估计。此外,多模态 LVMs 还为众多下游零样本推理应用带来了机会,例如开放词汇分类 / 检测 / 分割和图像编辑 / 生成。

另一方面,LVMs 带来了社区需要解决的挑战和风险:训练成本高昂且对环境产生负面影响;LVMs 太大而无法在下游数据集上进行微调;网络数据分布不均可能导致社会偏见(性别和种族)和不平等;LVMs 的常识推理能力仍然落后;等等。

本期特刊寻求对推进 LVMs 的原创性贡献——在开发、评估、适应、应用、理解等方面——并解决 LVMs 所带来的潜在负面影响。其内容应与以下范畴有关(但不限于):

  • Training or adaptation methods for LVMs
  • LVM architecture designs (not limited to Transformer-based models)
  • Visualizing and interpreting LVMs
  • Emergent capabilities of LVMs
  • Applications and use cases of LVMs in computer vision
  • Theoretical insights into LVMs
  • Generalization and robustness of LVMs
  • Evaluation, biases, fairness, and safety of LVMs

重点日期:

  • Full paper submission deadline: March 1st, 2023
  • Review deadline: April 30th, 2023
  • Author response deadline: May 26th, 2023
  • Final notification: June 26th, 2023
  • Final manuscript submission: July 26th, 2023

客座编辑:

  • Kaiyang Zhou, Nanyang Technological University, Singapore
  • Ziwei Liu, Nanyang Technological University, Singapore
  • Xiaohua Zhai, Google Brain, Switzerland
  • Chunyuan Li, Microsoft Research, Redmond, US
  • Kate Saenko, Boston University, US

详情请访问以下网页:https://kaiyangzhou.github.io/assets/cfp_ijcv_lvms.html