学术报告

你现在的位置: 首页 > 学术报告

6月9日 黄隆波副教授学术报告

发布时间:2023-06-09

报告题目:鲁棒与风险感知在线学习与强化学习算法设计

 

主讲人:黄隆波副教授,清华大学交叉信息研究院

 

报告时间:2023/06/09 10:00-12:00

 

报告地点:东校园兰园6号212课室

 

主持人:夏俐教授

 

摘要:

       在线学习与强化学习近年来在许多重要场景中得到了关注与成功应用,包括搜索、推荐与网络控制等。在上述问题中,智能体需要与环境进行交互,并优化策略效用。已有成果往往主要关注算法的性能,而较少关注算法鲁棒性与风险控制。在本报告中,我们将介绍团队在在线学习与强化学习方向的近期工作,包括关于Heavy-tailed MAB问题下的Best-of-Both-Worlds算法及基于lteratedCVaR指标的风险感知强化学习算法。

 

主讲人简介:

       黄隆波博士是清华大学交叉信息研究院长聘副教授。黄博士毕业于南加州大学,并曾于加州大学伯克利分校担任博士后研究员。其曾先后于麻省理工学院与加州大学伯克利分校担任访问学者,于法国贝尔实验室与香港中文大学担任访问教授,并于2016年秋季在伯克利Simons计算理论研究院担任长期访问科学家。博士曾获清华大学先进工作者,清华大学“良师益友”,谷歌科研奖与微软亚洲研究院联合科研奖,入选微软亚洲研究院“铸星计划”,并于2018年获ACM SIGMETRICS青年科学家奖。