2005年,史蒂夫•乔布斯(Steve Jobs)在D3数字大会上给出了一个设想:操作系统能不能不带文件系统?他的理由是,不论是电子邮件还是iTunes还是照片,这些应用都可以让用户很好地管理和找到对应的文件,系统层面的文件管理应该透明,不需要用户去使用。在iOS上,乔布斯这一设想得到了实现,iOS一直没有文件管理系统,不同文件只能在对应的App中才能被打开。
不过,前几天的WWDC 2017年却改变了这一点:苹果宣布iOS11将内置Files文件管理器,这就跟MacOS的Finder一样,可以对文件进行管理,跨终端,跨平台,不只是iCloud,百度网盘也成了首批接入Files的第三方存储服务。
Files接入百度网盘意味着什么?
这不是苹果第一次与百度牵手。2015年Siri就接入了百度知识库,弥补了苹果在中文知识上的短板。接入百度知识库后,Siri可以向用户提供地理人文常识、当地美食、古今中外名人、热门话题、动物百科、知名旅游景点和常见品牌介绍,而不只是设下闹钟。苹果彼时选择百度的原因正是看中后者在中文搜索市场的主导者地位,这一次Files接入百度网盘同样是因为后者在个人云存储中的优势。
去年许多个人云存储平台因为缺乏有效的商业模式、难以符合相关部门的监管要求,纷纷宣布关闭,国内剩下的云存储玩家只有百度网盘、天翼云和腾讯微云了,百度网盘堪称一家独大。去年10月,在上线四周年之际,百度网盘当时的用户数就已经突破4亿,覆盖了大部分中国网民,也覆盖了几乎所有个人云存储用户。
因此,Files接入百度网盘就在情理之中了。从WWDC 2017年也能明显感受到,苹果还在继续加大对中国市场的重视力度,在iOS上加入了二维码识别的支持、扩展了防垃圾短信功能等等,在Files上接入中国最普及的云存储服务自然就显得很有必要。从另一个角度来看,Files直接在文件管理层面接入第三方云存储服务,将其与本地文件对等,表明了未来用户数据存储的一个趋势:跨设备,跨平台,并且不会区分云端还是本地。可以预见,云存储只会变得越来越普及,越来越重要。
百度网盘是百度AI战略的重要棋子
从Files接入多家云存储的动作来看,个人云存储的市场潜力正在释放出来。美国个人云存储巨头Dropbox估值高达40亿美金,苹果也在愈发依赖iCloud所带来的服务型收入。不过,百度网盘对于百度来说,还有另一层价值所在:AI战略的一颗棋子。
第一,百度网盘可应用人工智能技术。
去年8月,Dropbox表示其已采取计算机视觉技术来检测应用程序扫描文档,今年4月,Dropbox将AI技术与OCR技术结合,帮助用户将扫描的文档转化成PDF。云存储不只是存储平台,还是一种生产力工具,而人工智能最广泛的应用就是提高效率,因此云存储与人工智能技术有许多结合空间。百度网盘也早已不只是一个存储空间,它还提供云笔记、文件共享、照片管理诸多功能,它也早已将图像识别等AI技术应用到存储数据的分类、查找、管理、搜索中,使用更简单、搜索更精准、响应速度更快。未来,对于云存储文件的审核管理、文件的智能归类、照片的智能管理、云笔记的智能记录,百度还可以结合人工智能技术做得更多。可见,百度网盘是百度人工智能技术的一个应用场景,百度得天独厚的人工智能技术优势,也让百度网盘在技术层面形成了核心竞争力。
第二,百度网盘可以为AI提供数据基础。
马化腾说,数据、计算力、人才和场景是人工智能的四大要素;李彦宏说,正是因为大数据的水平提升,计算能力加强,计算成本更低廉,人工智能才顺利地进入工业应用领域。马云说,数据是原料,没有数据什么都不行。可以看到,BAT大佬都认为数据对于人工智能的重要性。
百度网盘作为中国最大的云存储平台,其单个用户在云端存储的数据都以TB计算,其所积累的数据量可想而知,同时这些数据中还有文件、照片、视频、笔记等不同类型的结构化数据,是深度学习不可多得的原材料。换言之,百度网盘的数据可成为百度AI算法改进的源数据,改进的算法又将进一步用到产品上来改进用户体验。
有人担心,用户个人数据被应用到机器学习会有什么安全隐患吗?这种担心是多余的,因为这些数据是被机器学习而不是被人识别,更不是被共享售卖或者用于其他商业用途。DropBox在将人工智能技术应用到文件扫描识别时也使用了用户上传的图像或文件进行学习,例如收据、发票、信件等。它在征得用户同意后,将这些文件脱敏,再对这些捐赠的数据采取各种安全措施,比如“绝不会将数据保留在本地部署的服务器上,保持持续并广泛的审计、部署强大的身份验证访问数据措施等。”同样,百度网盘完全可以在不侵犯用户利益的前提下来将数据用于机器学习。
云存储服务在AI时代将发挥关键作用
如果数据分散在不同设备上,那么机器根本没有对海量数据进行深度学习的机会,人工智能无从谈起。美图秀秀之所以能够在美化人脸的算法上越做越好,正是因为它掌握了海量人脸大数据。百度之所以在搜索上能够越来越理解用户的自然语言,正是因为它每天响应60亿次搜索请求积累了用户需求数据……这些数据无一例外地都被收集和存储在云端。
在人工智能时代,云存储服务将发挥至关重要的作用。对于云计算、大数据和人工智能的关系,马化腾曾给出一个精辟的总结,其认为“未来就是在云端用人工智能处理大数据”,李彦宏的看法则是,“人工智能时代最宝贵的不是数据,是数据带来的技术创新。”这都表明没有数据人工智能就是空谈,有了数据人工智能算法才会进步,才会有创新应用。而数据有效的前提都是,它要被收集和存储到云端。
理论上来说,用户会被动地产生许多数据并且被存储到云端,比如每一次购物,每一次搜索,每一次刷信息流,都会贡献数据。但还有一大类数据是用户主动生产、主动上传的,比如文件、照片、笔记、录音、视频等等,这些数据对于人工智能而言同样具有重要的挖掘价值。还有一点至关重要的是,IoT时代,智能汽车、智能摄像头、智能路由器、智能可穿戴设备,越来越多的联网硬件在孜孜不倦地生产着数据,这些数据同样会被同步到云端,最终成为人工智能技术的原材料。
可以看到,不论是用户主动上传的数据还是IoT设备所产生的数据,都需要同步到云存储平台上。换句话说,云存储平台将会是未来的云端数据中心,这意味着它在AI时代将扮演关键角色,这样来看,百度网盘在百度AI战略中更是不可或缺了。