北京科学与工程计算研究院学术报告之八十五

报告人/Speaker: 夏俐 (清华大学)


报告题目/Title: 强化学习与智能决策


时间/Date & Time: 2018年11月13日,10:30—11:30


地点/Location: 理科楼M843  


报告摘要/Abstract:
随着AlphaGo的成功应用,强化学习得到了学术和工业界的日益重视。强化学习是机器学习的重要方法之一,其本质是研究随机动态系统的决策优化问题,也是一个涉及计算机、控制论、运筹学、心理学等多学科的深度交叉研究方向,独具研究挑战和吸引力。本报告将主要介绍近年来强化学习的发展,包括人工智能与深度学习的发展、AlphaGo的主要原理、强化学习的基本原理与主要算法,同时也简要汇报报告人在强化学习的复杂度分析、机器人学习控制等方面的研究工作,并讨论可能的若干研究方向。


报告人简介/About the speaker:

夏俐,副教授,博士生导师,清华大学自动化系智能与网络化系统研究中心,系统工程专业。长期从事随机动态决策系统的学习优化理论研究,以及在能源系统、智能建筑、对抗决策等领域的应用研究工作。分别于2002年和2007年在清华大学自动化系获得学士和博士学位,博士生期间在香港科技大学随导师曹希仁教授从事科研工作,博士毕业后分别在IBM中国研究院、沙特国王科技大学从事科研工作,2011年至今在清华大学自动化系工作,2015年以访问学者身份在美国斯坦福大学管理科学与工程系从事合作研究。在动态决策优化、马氏决策过程、强化学习、排队论等领域有大量研究工作,发表论文60余篇,其中IEEE Trans. Automatic Control、Automatica、Euro. J. Oper. Res.等本领域顶级期刊论文近20篇,获得美国专利3项、中国专利5项。担任国际SCI期刊Discrete Event Dynamic Systems、Energy Informatics等编委和多个国际学术会议的程序委员会委员,担任IEEE高级会员、中国自动化学会青年工作委员会常委、中国自动化学会自适应动态规划与强化学习专委会委员、中国人工智能学会动态规划与智能自适应学习专委会委员等学术兼职。