Call for Papers
International Journal of Computer Vision (IJCV)
Special Issue on The Promises and Dangers of Large Vision Models
在过去十年里,深度学习彻底颠覆了计算机视觉领域,在许多视觉计算问题上带来了巨大的突破。最近我们观察到另一种趋势在社区里受到了广泛的关注和研究,即视觉模型的扩展,从长远来看可能会对该领域产生重大的影响。
具体来说,视觉模型的大小从几千万参数成倍增长到几亿,甚至几十亿,尤其是在 Vision Transformer 出现之后。此外,训练数据的规模和多样性也随着模型容量的增长而急剧增加,不仅表现在数量上,也表现在形式上(例如结合图像和语言)。在这里,为了简洁起见,我们将此类模型称为大视觉模型 (Large Vision Models or LVMs),其中包括单模态视觉模型和多模态视觉模型(例如视觉语言模型)。
一方面,从大规模数据中学习的 LVMs 在泛化方面表现出强大的能力:它们可以应对广泛的领域或场景,并且可以轻易适应多种视觉任务,例如图像分类 / 字幕 / 分割、对象 / 关键点检测和深度 / 表面法线估计。此外,多模态 LVMs 还为众多下游零样本推理应用带来了机会,例如开放词汇分类 / 检测 / 分割和图像编辑 / 生成。
另一方面,LVMs 带来了社区需要解决的挑战和风险:训练成本高昂且对环境产生负面影响;LVMs 太大而无法在下游数据集上进行微调;网络数据分布不均可能导致社会偏见(性别和种族)和不平等;LVMs 的常识推理能力仍然落后;等等。
本期特刊寻求对推进 LVMs 的原创性贡献——在开发、评估、适应、应用、理解等方面——并解决 LVMs 所带来的潜在负面影响。其内容应与以下范畴有关(但不限于):
- Training or adaptation methods for LVMs
- LVM architecture designs (not limited to Transformer-based models)
- Visualizing and interpreting LVMs
- Emergent capabilities of LVMs
- Applications and use cases of LVMs in computer vision
- Theoretical insights into LVMs
- Generalization and robustness of LVMs
- Evaluation, biases, fairness, and safety of LVMs
重点日期:
- Full paper submission deadline: March 1st, 2023
- Review deadline: April 30th, 2023
- Author response deadline: May 26th, 2023
- Final notification: June 26th, 2023
- Final manuscript submission: July 26th, 2023
客座编辑:
- Kaiyang Zhou, Nanyang Technological University, Singapore
- Ziwei Liu, Nanyang Technological University, Singapore
- Xiaohua Zhai, Google Brain, Switzerland
- Chunyuan Li, Microsoft Research, Redmond, US
- Kate Saenko, Boston University, US
详情请访问以下网页:https://kaiyangzhou.github.io/assets/cfp_ijcv_lvms.html