报告题目:面向大数据的机器学习方法:从数据到模型
报告人:潘为 博士 (英国帝国理工学院,数据科学研究院副研究员)
报告时间:9月2日(星期五)上午10:00
报告地点:南一楼中311室
邀请方:“多谱信息处理技术”国家级重点实验室
个人简介:潘为博士现任帝国理工学院数据科学研究院副研究员。2008年在哈尔滨工业大学获得自动化学士学位,于2011年在中国科技大学获得生物医学工程硕士学位,于2015年在帝国理工学院获得生物工程博士学位。主要从事智能电网、智能制造等系统的大数据机器学习理论与方法研究。
报告摘要:生物学、物理学、工业制造领域的复杂过程,每分每秒都会诞生大量不同来源的数据,也蕴含着许多反常的动力学现象,难以用常规方法进行因果性分析和预测。虽然近年来研究者们收集了大量的多维度多来源数据,但是至今没有系统的方法可以从这些数据中自动生成非线性动力学模型,从而帮助人们深刻理解过程的动力学本质,并指导控制器设计。本工作通过重点挖掘时间序列流数据的两个关键特征:即高维度和大尺度特征,系统的研究了稀疏建模策略,提出了非线性动力学系统类别选择的评估方法。进而设计了系统辨识中的正则化机器学习框架,实现了给予高维度大规模时间序列数据中的非线性动力学系统建模,并将其扩展到深度学习系统中的深度神经网络,在一类智能电网建模中获得了成功的应用。