俄勒冈州立大学Tom Dietterich教授应邀在人工智能实验室CoAI课题组访问交流

11月12日,俄勒冈州立大学的杰出教授 (Distinguished Professor) Tom Dietterich教授在清华大学计算机系人工智能实验室(朱军教授邀请)访问期间,应邀与对话式交互智能(Conversational Artificial Intelligence,CoAI)小组的师生一起进行讨论和交流,双方共同讨论了强化学习方法和应用的相关问题。


AAAI前主席Dietterich教授作为通用机器学习技术奠基人之一,其研究贡献主要包括将纠错输出编码应用于多类分类问题,他发明了多示例学习、层次强化学习MAXQ框架及将非参数回归树整合到概率图模型中的方法。讨论会上CoAI课题组(朱小燕教授)与Interactive Robotics课题组(张崇洁教授)的师生展示了各自的相关工作,并一同进行了深入的交流。




交叉信息学院InteractiveRobotics课题组的李斯源同学介绍了基于层次化强化学习(HRL)的source policies selection,用于将一些学习过的策略迁移到新的任务。


计算机系人工智能实验室CoAI课题组的高信龙一同学介绍了基于HRL的aggregated search,用于在搜索场景下统合不同类别的信息源。张天扬同学介绍了刚被AAAI 19接收的工作“A Hierarchical Framework forRelation Extraction with Reinforcement Learning”。张蒲石同学介绍了temporal correlation modeling,提出一种基于时间上的序列分布重构优化目标的方法。黄民烈博士介绍了WWW18的工作“Learning to Collaborate:Multi-Scenario Ranking via Multi-Agent Reinforcement Learning”。