地理空间AI突围:机器学习云平台穿越数据迷雾

千百年来,当洪水、龙卷风和野火等自然灾害发生时,往往会造成难以预期的损失。而伴随云计算、大数据、AI等新兴技术的协同发力,这些灾害的破坏性更有可能得到控制,甚至在萌芽之初就被扼杀在摇篮里。

特别是最近几年,地理空间数据与人工智能的频繁接触,堪比“金风玉露一相逢”,改变了人间的无数场景——其应用范畴已不局限于灾害应对,而是扩展到监测气候变化、协助规划可持续城市发展、优化门店选址和销售分析、评估风险及保险索赔等领域。

权威机构发布的《地理空间分析人工智能市场预报(2022-2027)》显示:未来五年,全球地理空间AI市场的年复合年增长率为30.0%。其中,基于云计算平台部署的地理空间AI市场增速更快,年复合增长率为38.9%。

市场需求的飞速发展,也带来诸多挑战。尤其在地理空间数据大爆发的背景下,备受倚重的机器学习(ML)面临多重压力:一是访问高质量的地理空间数据集需要与多个数据源和供应商合作;二是为训练和推理准备大量地理空间数据既耗时又昂贵;三是需要专门的工具来可视化地理空间数据并与MLOps基础设施集成;四是数据科学家通常要掌握地理空间专业知识,但学习曲线颇为陡峭。

何以解忧?不妨上云。在通用计算领域长袖善舞的云平台,正在朝高性能计算、人工智能等方向加速渗透,借助机器学习、深度学习等方面的赋能,为千行百业的数字化转型提供更全面有力的支撑。地理空间AI在成长路上遭遇的烦恼,正是云平台发力的重点。

近日,亚马逊云科技数据与机器学习副总裁Swami Sivasubramanian在2022亚马逊云科技re:Invent全球大会上发布Geospatial ML with Amazon SageMaker (preview),开创性地将地理空间数据集成到机器学习平台,让灾害应对、城市规划、门店选址变得举重若轻且更加智能。

有了云平台的加持,机器学习有望穿越地理空间数据的重重迷雾,创造更多的人间胜景。

地理空间AI的演进路径

在讲述地理空间数据、机器学习与云平台相互交织的故事之前,先要追根溯源,盘一盘地理空间AI的前世今生。

就经典定义而言,地理空间AI是指地理空间科学与人工智能相结合,通过研究与开发机器的空间智能提升对于地理现象和地球科学过程的动态感知、智能推理和知识发现能力,并寻求解决人类和地球环境系统相互作用中的重大科学和工程问题。

如果仔细梳理地理空间AI崛起背后的驱动力量,会发现主要来自三个方面的助推:

首先,源自卫星、遥感、地图等领域的地理空间数据显著增加。在过去的二十年,将卫星送入低地球轨道的发射成本从平均18500美元/千克降至2720美元/千克,这极大提升了卫星的发射数量以及由此衍生的地理空间数据;遥感能力的提高也引发观测数据的激增,Northern Sky Research预测到2027年,该市场将达到69亿美元的规模。

其次,人工智能(尤其是机器学习和深度学习)的迅猛发展,为解决地理空间数据领域的痛点提供了可能。例如:不断产生的时空数据可以支持人工智能模型训练和新算法的研发,地理信息系统(GIS)也能为机器学习模型标注数据(如土地利用类型、自然灾害后建筑破损信息等)的生成给予便捷支持。

再次,海量计算能力的可用性为地理空间AI扩展应用场景奠定坚实基础。相关统计显示,数字宇宙的规模每两年翻一番,到2025年将达175ZB。人工智能应用要在海量数据集上蓬勃发展,离不开强大的计算和存储基础设施的支撑,而在通用计算、高性能计算方面日益强大的云平台,恰可扮演“数字底座”的重要角色。

机器学习×云平台加速进化

从地理空间AI的演进轨迹不难看出,机器学习不断向纵深发展为其开疆扩土创造了必要条件,而云平台作为数字底座则发挥着不可替代的支撑作用。当机器学习遇到诸多挑战时,云平台有望成为其破局的最佳拍档。

在这样的背景下,2022亚马逊云科技re:Invent全球大会上重磅推出Geospatial ML with Amazon SageMaker (preview),堪称大型云厂商颇具示范效应的举措,为机器学习与云平台的深度融合树立了崭新的标杆。

针对机器学习在地理空间领域面临的痛点,Amazon SageMaker开创性地将地理空间数据集成到机器学习平台,支持使用地理空间数据构建、训练和部署ML模型,具备突出的竞争优势——可访问随时可用的地理空间数据源、高效处理大规模地理空间数据集、采用内置预训练ML模型加速模型构建、使用可视化工具分析和探索预测等。

从工作原理的角度看,使用 Amazon SageMaker的地理空间ML,能够得到全生命周期的赋能:

在访问地理空间数据源阶段,可使用来自亚马逊云科技上开放数据的数据源,亦可携带客户获得许可的地理空间数据,或通过交互式查询数据导入其感兴趣的区域;

在转换与丰富数据环节,可应用镶嵌和重采样的方式,将多个图像组合成多光谱、更高分辨率的图像,也可使用反向地理编码和 POI查找,将原始GPS位置映射到Open Street Map上的路段;

在使用预置模型或自定义训练模型阶段,可识别并移除浑浊的像素和阴影,自动识别不同土地类别,检索隐藏的地面信息或提取地标,并能自定义模型或容器,为模型训练的地理空间数据集创建高质量标签;

在模型部署环节,能一键部署、微调预训练地理空间模型,并可借助SageMaker JumpStart轻松管理地理空间数据资产,基于使用预配置的笔记本还可对已部署的模型执行推理;

在可视化预测阶段,可使用3D加速图形分析和探索交互式地图上的预测,也能实现跨团队可视化共享预测和映射数据,以提高决策质量。

场景化落地的远大前程

从更长远的视角来看,Amazon SageMaker不仅解决了机器学习在地理空间数据领域困扰已久的难题,而且显著扩展了ML的应用场景,为地理空间AI的真正落地铺平了道路。

就场景的丰富性而言,Amazon SageMaker除了巩固在气候变化监测、城市可持续发展等传统领域的优势外,还将触角延伸到风险评估和保险理赔、洞察交易策略、零售需求预测、提高粮食产量等新场景中,最大限度挖掘了ML的潜能。

以零售需求预测为例:在Amazon SageMaker的驱动下,可跟踪高增长的城市地区,辅助客户建立更好的供应链和销售渠道,或将位置和地图数据与竞争情报相结合,优化客户的业务布局。

很多国际知名的汽车企业都是Amazon SageMaker的忠实拥趸。宝马公司希望通过训练机器学习模型,找到发动机类型和驾驶特征之间的相关性,进而预测特定车队转换为电动汽车的可能性。由于车队使用的是完全匿名的数据,必须借助GPS轨迹和地理空间数据来建立相关性,Amazon SageMaker在这方面可提供强大的助力,使预测的准确率超过80%。

这不是故事的结尾,一切才刚刚开始。基于地理空间数据的机器学习模型,亚马逊云科技和宝马公司还能帮助城市规划者预测交通法规如何潜在地影响汽油排放,以及充电基础设施和停车位的可用性将怎样引导驾驶模式的转变。既然序曲如此精彩,机器学习×云平台的华彩乐章更值得期待。🖋

点击阅读原文,re:Invent2022深度解读大会

作者关健,《IT创事记》合伙人、主笔:曾任《电脑商报》常务副社长兼执行总编、《中国计算机报》助理总编,媒体从业时间超过10年。

关健长期关注科技产业动态及趋势,与逾百位高科技公司领导者进行过对话,亦在众多科技会议与论坛中担任嘉宾主持。