来源:medicalxpress
编辑:元子、啸林
【新智元导读】眼睛中的神经细胞是如何感知运动信号的?它们又是怎样把感知信号转化成神经信号传递给大脑的?这个秘密一旦被揭露,或许能够让计算机视觉取得前所未有的飞跃。「新智元急聘主笔、高级主任编辑,添加HR微信(Dr-wly)或扫描文末二维码了解详情。」
今天,我们可以看到计算机视觉(CV)系统在医疗保健,安全,运输,零售,银行,农业等领域的成功应用,已经深刻地改变了整个行业。
刚刚过去的2019年(然而这个数字却突然变得好像很遥远),我们看到了许多新颖的架构和方法,进一步提高了视觉系统的感知和生成能力。
目前我们在计算机视觉方面的研究,依然是依托卷积神经、自监督学习等理论,这在去年CVPR、ICCV等计算机视觉顶会上的几篇论文中得到了非常好的体现。
EFFICIENTNET:对卷积神经网络的模型缩放的重新思考
Google Research Brain Team的研究人员介绍了一种更好的扩大卷积神经网络(CNN)的方法。按照惯例,随着可用资源的增多,首先要开发CNN,然后再根据输入图像的深度,宽度或分辨率进行放大。
作者表明,如果仅将这些参数之一放大,或者将所有参数任意放大,相对于所需的额外计算能力,这都会导致收益迅速减少。相反,他们证明了存在最佳的深度,宽度和分辨率比率,以使效率和准确性最大化。这称为复合缩放。
EfficientNet在8个数据集中的5个获得了更好的精度,平均参数减少了9.6倍。特别是,具有66M参数的EfficientNet在ImageNet上达到了84.4%的top-1精度和97-1%的top-5精度,比GPipe(557M参数)小8倍,快6倍,这是目前最好的成绩。
面向视觉导航的增强型跨模态匹配和自监督模拟学习
视觉语言导航要求机器使用口头指令和视觉感知来导航真实的3D环境。
对人眼来说,这是一项再简单不过的任务。但对人工智能而言,这是一项极具挑战性的任务,因为它需要将语言线索与给定的物理环境相匹配,并且需要解析与该环境有关的语义指令。
研究人员提出了一种新的强化跨模态匹配(RCM)方法,该方法通过强化学习(RL)在本地和全球范围内实施跨模态接地。
最终,RCM框架在以下方面优于R2R数据集上的最新视觉语言导航方法:
- 将SPL分数从28%提高到35%;
- 成功率提高了8.1%。
- 此外,使用SIL模仿RCM代理先前在训练集上的最佳体验,会导致平均路径长度从15.22m下降到11.97m,而SPL度量的平均结果更好(38%)
计算机视觉最初的灵感来自于人类的视觉。在我们所有的感官中,视觉尤为重要,因为它使我们能够发现并避免危害。
例如,视觉可确保我们在高峰时段穿越繁忙的道路时能够快速,准确地确定汽车和自行车从何处驶近以及它们以多快的速度行驶。
当物体在我们的视野中移动时,眼睛中的神经细胞就会感知并发出运动方向的信号。然而,这些神经细胞如何对大脑皮层中的神经细胞产生影响,仍然是一个谜。
如果这个谜底无法揭开,恐怕很难让计算机视觉达到我们希望达到的境界。
揭秘视觉细胞如何让将运动信号形成大脑意识
最近,奥尔胡斯大学(Aarhus University)的研究人员绘制了将视觉运动的信息传递到大脑皮层的神经细胞的功能图。这将使我们对大脑中意识的感觉印象如何产生有了全新的认识。研究结果已在《自然通讯》上发表。
“我们已经描述了一种特殊的神经回路,该回路从眼睛的神经细胞到大脑皮层的神经细胞发送有关视觉运动的信息。这很重要,因此我们可以开始了解大脑中意识性感觉印象如何产生的机制。”一作作者Rune Nguyen Rasmussen解释说。
从长远来看,它可能会使研究人员理解和治疗大脑感觉功能失调的疾病,比如痴呆,或精神分裂症患者是如何出现幻觉的。
颠覆常识:以前认为在大脑皮层中产生的东西实际上已经在眼睛中出现了
“如果视觉没有感知运动的能力,就会导致严重的后果,如我们从那些丧失了感知物体运动能力的人身上所看到的。”
通过结合一系列先进的实验方法,并使用小鼠作为影响眼睛中特殊神经细胞的动物模型,研究人员能够了解眼睛神经细胞如何影响大脑皮层神经细胞。
在这项研究中,研究人员证明了眼睛中一组特殊的神经细胞可确保大脑皮层中的视觉神经细胞可以感知并响应高速的视觉运动。
最有趣的地方是,它意味着以前认为在大脑皮层中产生的东西实际上已经在视觉的最早阶段即眼睛中出现了。
“我们研究后剩下的一个重要问题是该神经回路如何以及何时涉及行为的各个方面。因此,我们研究的下一步将是了解老鼠四处移动并需要在周围环境中导航时,这个神经回路是否参与了感知视觉运动。” 论文一作Rune Nguyen Rasmussen说。
本文一作Aarhus大学博士生,第一篇论文即上Nature子刊
本文一作是奥尔胡斯大学的博士研究生Rune Nguyen Rasmussen,他的研究重点是视觉皮层是如何把视觉信息流转换成神经元消息的。
发了第一篇实验室论文,Rasmussen高兴地发推庆祝:
我在Yonehara团队的第一篇实验室论文发表在了《自然通讯》上,我非常兴奋!在这项工作中,我们发现了一个从小鼠视网膜方向选择性细胞发出信号的分离的皮层流。
参考链接:
神经回路映射:现在我们更好地理解视觉
https://medicalxpress.com/news/2020-04-neural-circuits-vision.html
Nature Communications原文参见:
https://www.nature.com/articles/s41467-020-14643-z