摘要: 随着云计算技术的成熟,越来越多的数据分析任务被放在云计算平台中处理。而面向数据分析应用的机器学习算法的超参数优化是一个非常耗时且耗费资源的过程。超参数优化执行的成本开销是用户关注的一个重要因素之一。目前,针对超参数优化的研究大部分以学习模型性能为目标,考虑成本开销的研究工作较少。由此研究了基于当前的超参数优化方法,在不改变学习模型性能(如准确率、查准率、召回率等)的基础上,使得超参数优化执行尽可能快的同时成本开销尽可能低。首先,生成一个包含多个并行分支的超参数优化工作流,每个分支上的所有任务都运行在同一台服务器上。然后通过有色装箱算法来决策这些分支所包含的任务。实验结果表明所提算法可以在保证执行时间的前提下减少成本开销。
中图分类号: