/ 中存储网

AWS发布AutoGluon开源库,三行代码创建一个模型

2020-01-13 00:58:01 来源:科技号

亚马逊AWS推出量子计算服务,致力量子生态系统

亚马逊AWS今天推出了一个新的开源库,帮助开发人员使用几行代码编写基于机器学习的应用程序,这些应用程序使用图像、文本或表格数据集。

建立依赖这些数据的机器学习应用程序并不是一件容易的事情。例如,开发人员需要知道如何调整表示构建人工智能模型时所做选择的“超参数”。他们还需要处理诸如神经架构搜索之类的问题,这使他们能够为自己的机器学习模型找到最佳的架构设计。

AutoGluon自动化了许多这些复杂的任务,并可以通过在已知对给定任务执行良好的默认范围内自动调整选项,创建一个只需三行代码的新机器收益模型。开发人员所要做的就是指定他们希望他们的模型被训练的速度,autoglion将在给定的时间范围内生成最强大的模型。

AutoGluon

亚马逊表示,AutoGluon可以识别包括图像和文本分类、目标检测和表格预测等任务的模型。它还提供了一个应用程序编程接口,让更有经验的开发人员来处理,这样他们就可以提高模型的预测性能。

AWS应用科学家Jonas Mueller在一份声明中说:“我们开发autoglon是为了使机器学习真正民主化,并使所有开发人员都能使用深度学习的能力。”。“AutoGluon解决了这个问题,因为所有选项都在默认范围内自动调整,已知这些范围对特定任务和模型都有很好的性能。”

星座研究公司(Constellation Research Inc.)分析师霍尔格·穆勒(Holger Mueller)对SiliconANGLE表示,许多企业缺乏快速构建新机器学习模型所需的开发人才,因此对能够简化流程的工具需求很大。

穆勒说:“亚马逊的AutoGluon是朝着这个方向迈出的关键一步,它使开发者能够在AWS的云基础设施上使用先进的人工智能技术。”。“通过CPU限制搜索最适合模型的能力特别有价值,因为预算和时间的实际限制也适用于人工智能解决方案。现在,我们将看到在开发人员基础上采用autoglon。不用说,要想赢得人工智能领域的领导地位,开发人员不会赢得,而是要让稍懂技术的商业用户利用人工智能。”

这大概就是为什么亚马逊开发了AutoGluon,这是一个开放源代码库,旨在使开发人员仅用几行代码即可编写AI嵌入的应用程序。它在GitHub上悄然兴起后大约一个月,于今天公开发布。

AutoGluon的目标是自动化开发人员历史上必须自己做出的许多决策。通常,像超参数调整这样的任务是手动执行的,需要科学家预测超参数(代表构建人工智能模型时所做的选择)将如何影响模型训练。另一个通常由人监督的任务称为神经架构搜索(neural architecture search),需要复杂的工程,至少在一定程度上,开发人员必须为其各自的模型确定最佳设计。

为此,AutoGluon可以通过自动调整默认范围内的选择来生成仅需三行代码的模型,而这些默认范围在已知范围内可以很好地完成给定任务。开发人员只需指定他们何时准备好其训练有素的模型,作为回应,AutoGluon就会利用可用的计算资源在分配的运行时中找到最强大的模型。

它以亚马逊和微软三年前进行的工作-Gluon为基础,后来又在Apache MXNet和微软的Cognitive Toolkit中发布。Gluon是一个机器学习界面,允许开发人员使用一组预先构建和优化的组件来构建模型,而AutoGluon则不断地处理开发过程。

AutoGluon开箱即用,可以识别用于表格预测,图像和文本分类以及对象检测的模型,并且它提供了API,可供经验丰富的开发人员使用以进一步改善模型的预测性能。它需要Python 3.6或3.7版本,并且目前仅支持Linux,但是Amazon表示Mac OSX和Windows版本很快就会推出。

“我们开发AutoGluon是为了让机器学习真正大众化,让所有开发人员都能使用深度学习的功能,”AWS应用科学家Jonas Mueller在一份声明中说。“AutoGluon解决了这个问题,因为所有的选项都会自动调整到默认范围内,而这些默认范围对于特定的任务和模型来说性能良好。”

AutoGluon的首次亮相是在对Amazon Web Services(AWS)的SageMaker进行重大升级之后进行的,该工具包用于不断培训机器学习模型并将其部署到云和边缘环境。AWS SageMaker Studio是一种模型培训和工作流管理工具,可将所有代码,笔记本和文件夹用于机器学习收集到一个地方,而SageMaker Notebook可让开发人员快速启动Jupyter笔记本进行机器学习项目。还有SageMaker Autopilot,可通过自动选择算法并调整模型来自动创建模型。SageMaker Experiments,用于测试和验证模型;SageMaker调试器,可提高模型的准确性;和SageMaker Model Monitor,它可以检测概念偏差。

Amazon之前发布了AWS深度学习容器,这是一个预装了流行深度学习框架的Docker图像库,以及一系列完全托管的服务,包括Personalize、Textract、Fraud Detector和CodeGuru。根据Statista的数据,凭借AutoGluon等独立工具,这家西雅图科技巨头正在追逐一个到2025年预计价值1186亿美元的市场。

AutoGluon只是AWS最新推出的一款产品,它旨在使机器学习民主化。该公司最近更新了SageMaker工具,用于持续培训和将机器学习模型部署到云和边缘环境中。更新包括SageMaker Studio,一个模型培训和工作流管理工具,它收集所有使用的代码和笔记本模型,并将它们保存在一个地方;SageMaker Autopilot,它通过自动选择最佳算法并针对特定任务对其进行调整,自动创建模型。构建涉及图像,文本和表格数据集的机器学习应用程序并不容易。它需要特征工程或使用数据领域知识来创建使AI算法起作用的特征,此外还需要进行大量数据预处理,以确保在经过训练的模型中不会出现偏差。