早在2017年11月,AWS第一次发布Amazon SageMaker机器学习平台服务时,我就提醒过自己,绝对不要小觑了这个新生的家伙,它的潜力超乎想象。
事实证明,我总是低估它。“或许这就是人类认知的极限性吧!”我只能这样安慰自己。
作为一项完全托管的服务,Amazon SageMaker可以帮助机器学习开发者和数据科学家快速构建、训练和部署模型——在数据爆炸的当前,这一点异常重要,也使得它成为最受欢迎的AWS云服务之一,吸引了全球超过10万家企业使用。
尽管如此,近三年,AWS依旧每年会新增超过200个新的机器学习服务和功能,最大限度地消除机器学习过程中那些繁复的工作,让高质量的模型开发成为可能。
在日前刚刚结束的re:Invent大会上,AWS全面展示了该公司在人工智能和机器学习方面的新进展,为Amazon SageMaker 又推出了九项新的功能,使之能够更加轻松地拓展到更多的行业和应用场景。
AWS全球机器学习副总裁 Swami Sivasubramanian表示,机器学习是当前最具颠覆性的技术之一,日益成为主流的它仍在快速发展,但是创建一个机器学习的模型却非常困难。
AWS全球机器学习副总裁 Swami Sivasubramanian
过去,只有最熟练的开发人员才能开展机器学习相关的工作。然而,Amazon SageMaker的出现,改变了这一现状,而最新发布的新功能,将使得开发人员和数据科学家更容易准备、构建、训练、部署和管理机器学习模型。
此前,机器学习的数据准备是一个复杂的过程,会消耗掉开发人员大量的时间。新发布的Amazon SageMaker Data Wrangler ,可以从根本上简化数据准备和特征工程的工作。
据悉,Amazon SageMaker Data Wrangler 包含超过 300 个内置的数据转换器,可以帮助客户在无需编写任何代码的情况下,对特征进行规范化、转换和组合。
客户可以通过Amazon SageMaker Studio(首个用于机器学习的端到端集成开发环境)查看这些转换,快速预览和检查这些转换是否符合预期。
在特征设计出来之后,Amazon SageMaker Data Wrangler会把它们保存在Amazon SageMaker Feature Store中,以供重复使用。
Amazon SageMaker Feature Store 提供了一个新的存储库,可以轻松地存储、更新、检索和共享用于训练和推理的机器学习特征,供开发人员访问和共享。
Amazon SageMaker Pipelines 则是业界第一个专门为机器学习构建的、易于使用的 CI/CD(持续集成和持续交付)服务,帮助客户实现工作流管理和自动化。
AWS首席执行官Andy Jassy
Amazon SageMaker Clarify的作用,是在整个机器学习工作流中提供偏差检测,使开发人员能够在其模型中实现更大的公平性和更高的透明度。
通过与Amazon SageMaker Experiments集成,Amazon SageMaker Clarify使开发人员更容易地检查训练好的模型是否存在统计偏差。
此外,Amazon SageMaker Clarify还可以与Amazon SageMaker Model Monitor集成,一旦模型特征的重要性发生偏移,导致模型预测质量发生改变,它就会提醒开发人员。
Deep Profiling for Amazon SageMaker Debugger能够自动监控系统资源利用率,为训练瓶颈提供告警,以方便开发者更快地训练模型。
Distributed Training on Amazon SageMaker,使得训练大型复杂深度学习模型的速度比当前的方法快两倍,可以更好地应用于自动驾驶、自然语言处理等场景。
顾名思义,Amazon SageMaker Edge Manager可以帮助开发人员优化、保护、监控和维护那些部署在边缘设备集群上的机器学习模型,确保它们以高精度运行。
通过Amazon SageMaker JumpStart,开发人员可以更加简易、便捷地搜索同类最佳解决方案、算法和notebook示例,快速地开始模型构建和训练等工作。
三年来,通过类似以上的工作,AWS不断拉近机器学习与行业应用之间的距离,帮助企业构建趁手的工具,从而实现了更大的商业价值。
AWS大中华区云服务产品管理总经理顾凡表示,AWS在机器学习上所做的一切,得益于自身使用机器学习服务20多年来的深厚积淀,以及对客户需求的及时感知与回馈。
AWS大中华区云服务产品管理总经理顾凡