管理学与经济学系列前沿讲座之四五一讲
主题
鲁棒与风险感知在线学习与强化学习算法设计
活动时间
-
活动地址
广州校区东校园兰园6号212课室
主讲人
黄隆波副教授,清华大学交叉信息研究院
主持人
夏俐教授,澳门新葡平台网址8883网站
主办单位
澳门新葡平台网址8883网站管理科学教研室
嘉宾简介:
黄隆波博士是清华大学交叉信息研究院长聘副教授。黄博士毕业于南加州大学,并曾于加州大学伯克利分校担任博士后研究员。其曾先后于麻省理工学院与加州大学伯克利分校担任访问学者,于法国贝尔实验室与香港中文大学担任访问教授,并于2016年秋季在伯克利Simons计算理论研究院担任长期访问科学家。黄博士曾获清华大学先进工作者,清华大学“良师益友”,谷歌科研奖与微软亚洲研究院联合科研奖,入选微软亚洲研究院“铸星计划”,并于2018年获ACM SIGMETRICS青年科学家奖。
讲座简介:
在线学习与强化学习近年来在许多重要场景中得到了关注与成功应用,包括搜索、推荐与网络控制等。在上述问题中,智能体需要与环境进行交互,并优化策略效用。已有成果往往主要关注算法的性能,而较少关注算法鲁棒性与风险控制。在本报告中,我们将介绍团队在在线学习与强化学习方向的近期工作,包括关于Heavy-tailed MAB问题下的Best-of-Both-Worlds算法及基于Iterated CVaR指标的风险感知强化学习算法。
扫描此二维码分享