一种成本有效的面向超参数优化的工作流执行优化方法

doi:10.13196/j.cims.2020.06.019

计算机集成制造系统 ›› 2020, Vol. 26 ›› Issue (6): 1628-1635.DOI: 10.13196/j.cims.2020.06.019

一种成本有效的面向超参数优化的工作流执行优化方法

姚艳¹,曹健²⁺

1.齐鲁工业大学(山东省科学院)计算机科学与技术学院
2.上海交通大学计算机科学与工程系

出版日期:2020-06-30 发布日期:2020-06-30
基金资助:
国家重点研发计划资助项目(2018YFB1003800);国家自然科学基金资助项目(61772334)。

Cost-effective workflow execution strategy for hyperparameter search

Online:2020-06-30 Published:2020-06-30
Supported by:
Project supported by the National Key Research and Development Program,China(No.2018YFB1003800),and the National Natural Science Foundation,China(No.61772334).

摘要/Abstract

摘要： 随着云计算技术的成熟,越来越多的数据分析任务被放在云计算平台中处理。而面向数据分析应用的机器学习算法的超参数优化是一个非常耗时且耗费资源的过程。超参数优化执行的成本开销是用户关注的一个重要因素之一。目前,针对超参数优化的研究大部分以学习模型性能为目标,考虑成本开销的研究工作较少。由此研究了基于当前的超参数优化方法,在不改变学习模型性能(如准确率、查准率、召回率等)的基础上,使得超参数优化执行尽可能快的同时成本开销尽可能低。首先,生成一个包含多个并行分支的超参数优化工作流,每个分支上的所有任务都运行在同一台服务器上。然后通过有色装箱算法来决策这些分支所包含的任务。实验结果表明所提算法可以在保证执行时间的前提下减少成本开销。

关键词: 云计算, 云工作流, 执行优化, 超参数优化

Abstract: With the maturity of cloud computing,increasing number of data analysis tasks are executed in cloud.Machine learning algorithm is a necessary part of data analysis,and the hyperparameter optimization for machine learning algorithms is a time-consuming and resource-consuming process.However,little research focuses on the final cost for executing hyperparameter optimization.For this reason,the method of executing the hyperparameter optimization as quick as possible with the lowest cost was studied on the basis of not changing the performance of learning model such as accuracy,precision,recall rate.An optimized workflow instance model was generated,which consisted of multiple parallel branches and each branch sequentially executed multiple models on a server.Based on the dual-colored bin packing algorithm,the branches were organized in such a way that they had a similar execution time and can be completed almost at the same time.Experimental results demonstrated that the proposed approach could meet the deadline and reduce the cost at the same time.

Key words: cloud computing, cloud workflow, execution optimization, hyperparameter optimization

中图分类号:

TP311

姚艳,曹健. 一种成本有效的面向超参数优化的工作流执行优化方法[J]. 计算机集成制造系统, 2020, 26(6): 1628-1635.

[1]	文一凭,王志斌,刘建勋,许小龙,康国胜. 云际协作环境下能耗与成本感知的工作流调度方法[J]. 计算机集成制造系统, 2021, 27(9): 2583-2591.
[2]	李文俊,杨学强,杜家兴. 基于云计算的装备保障信息系统集成[J]. 计算机集成制造系统, 2021, 27(7): 1941-1950.
[3]	彭定洪,黄子航,王铁旦,彭勃. 面向云计算部署方案评价的区间犹豫模糊双重妥协评价方法[J]. 计算机集成制造系统, 2021, 27(6): 1768-1779.
[4]	潘燕华,王克,王平. 云计算环境下复杂产品价值链合作伙伴选择研究[J]. 计算机集成制造系统, 2021, 27(12): 3651-3658.
[5]	林国丹,黄钦开,余阳,潘茂林. Activiti引擎的无状态云工作流调度算法[J]. 计算机集成制造系统, 2020, 26(6): 1456-1464.
[6]	景轩,姚锡凡. 大数据驱动的云雾制造体系架构[J]. 计算机集成制造系统, 2019, 25(第9): 2119-2139.
[7]	文一凭,刘建勋,窦万春,陈爱民,周昱昊. 云工作流环境下隐私感知的多租户访问控制模型[J]. 计算机集成制造系统, 2019, 25(第4): 894-900.
[8]	单子丹,邹映,李雲竹. 基于云计算的服务型制造网络流程优化与决策模型[J]. 计算机集成制造系统, 2019, 25(12): 3139-3148.
[9]	姚艳,曹健,田晓亮. 实时分析工作流调度方法[J]. 计算机集成制造系统, 2018, 24(第7): 1698-1705.
[10]	张心言,任开军,赵成武,邓科峰. WRF与NPB科学计算程序在云平台上的性能研究[J]. 计算机集成制造系统, 2018, 24(第7): 1816-1821.
[11]	方伯芃,孙林夫. 面向QoS与成本感知的云工作流调度优化[J]. 计算机集成制造系统, 2018, 24(第2): 331-348.
[12]	王铮,王宇乐,王万良. 面向智能物联的动态负荷预测量子进化方法[J]. 计算机集成制造系统, 2018, 24(第12): 3027-3037.
[13]	李学俊,陈千,刘祥俊,钟云香,徐佳,朱二周. 基于动态定价组合反向拍卖的云工作流系统资源分配机制[J]. 计算机集成制造系统, 2017, 23(第5期): 941-946.
[14]	文一凭,窦万春,刘建勋,陈爱民,周旻昊. 安全与成本感知的实例密集型云工作流调度方法[J]. 计算机集成制造系统, 2017, 23(第5期): 955-962.
[15]	郑宏升,俞东进,张蕾. 基于萤火虫算法和动态优先级的多QoS云工作流调度[J]. 计算机集成制造系统, 2017, 23(第5期): 963-971.

一种成本有效的面向超参数优化的工作流执行优化方法

Cost-effective workflow execution strategy for hyperparameter search

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics