| 雷峰网
0
本文作者: 奕欣 | 2018-02-07 00:51 |
雷锋网 AI 科技评论消息,第 32 届 AAAI 大会(AAAI 2018)日前已经进入到第三天。当地时间 2 月 6 日上午,AAAI 组委会进行了 AAAI 大会奖项(AAAI Conference Awards)的宣布,颁奖仪式同期进行。
雷锋网AI 科技评论作为持续关注顶级学术会议的雷锋网学术频道,从 2016 年开始涉足、参与并报道国际学术会议,不仅为读者带来一线精彩报道,更为人工智能相关领域的学者们提供更多纵览全球学术会议的机会。如果读者们想了解雷锋网 AI 科技评论 2017 年走遍全球 11 个学术顶会所带来的精彩报道,欢迎扫描文章底部二维码,了解 AI 科技评论的年度特辑。
AAAI 2018 今年共收到论文投稿 3808 篇,接收论文 938 篇,接收率约为 24%。AAAI 大会评出杰出论文、杰出学生论文各一篇,杰出论文提名、杰出学生论文提名各一篇,以及经典论文一篇。尽管《Memory-Augmented Monte Carlo Tree Search》获得 AAAI 2018 杰出论文的消息早已传播开来,但论文内容直到上周末才正式公开;此外,这篇杰出论文的第一作者和第二作者均为华人。
杰出论文奖
《Memory-Augmented Monte Carlo Tree Search》记忆增强的蒙特卡洛树搜索
作者:Chenjun Xiao,Jincheng Mei,Martin Müller
获奖理由:这篇论文基于记忆结构的值逼近,为实时蒙特卡罗树搜索提供了理论分析和实践验证。
论文摘要:这篇论文提出并评估了记忆增强蒙特卡洛树搜索(M-MCTS),这一方法为在线实时搜索提出了一种新的利用泛化性的方式。记忆增强蒙特卡洛树搜索的关键思路是把蒙特卡洛树搜索和一个记忆结构组合起来,记忆结构中的每个存储位置都可以包含某个特定状态的信息。通过综合类似的状态的估计结果,这些记忆可以生成逼近的估计值。作者们展示了,在随机情况下,基于记忆的逼近值有更高可能性比原始的蒙特卡洛树搜索表现更好。作者们也在围棋游戏中评估了记忆增强蒙特卡洛树搜索,实验结果表明,在同样的模拟步数下记忆增强蒙特卡洛树搜索也比原始版本有更好的表现。
论文地址:https://webdocs.cs.ualberta.ca/~mmueller/ps/2018/Chenjun-Xiao-M-MCTS-aaai18-final.pdf
杰出论文提名
《Generalized Adjustment Under Confounding and Selection Biases》对选择偏倚和混杂偏倚的泛化调节处理方法
作者:Juan D. Correa,Jin Tian,Elias Bareinboim
获奖理由:论文提出了一个新的方法,使之能排除选择偏倚和混杂偏倚的干扰,以计算因果效应
论文摘要:选择偏倚和混杂偏倚是限制常见推理方法在大尺度环境下使用的最常见的两个障碍。在这篇论文中,作者们泛化了后门调节的想法,以便同时处理这两种偏倚,并且在不引入选择偏倚的情况下利用可能的外部数据(比如来自人口调查的数据)。作者们介绍了调节对(adjustment pair)的思路,并展示了通过调节方法识别因果关系的完整图形条件。作者们还进一步设计了一个算法,以多项式形式列出所有可以处理的调节对,对于希望评估以部分可处理的调节对的特定属性(常见属性包括开销、变化、测量难度)的研究人员来说这会很有用。最后,作者们描述了一种统计性的估计过程,一旦确认了某个设置是可以处理的就可以执行这个过程;它可以用来处理有限样本中的多种问题。
论文地址:https://pdfs.semanticscholar.org/023a/a92487c037a7557b9b74e894003725afd00a.pdf
杰出学生论文
《Counterfactual Multi-Agent Policy Gradients》反事实多智能体策略梯度
作者:Jakob Foerster, Gregory Farquhar, Triantafyllos Afouras, Nantas Nardelli, Shimon Whiteson
获奖理由:提出了一种新颖的多智能体强化学习算法以增加可应用于实时策略游戏的信用赋值。
论文摘要:许多现实世界中的问题,比如网络数据包的路由,或者自动驾驶汽车之间的协调,都可以很自然地看作合作性的多智能体系统问题来建模。这就对新的强化学习方法提出了强烈的需求,以便为这些系统高效地学习到区中心化的运行策略。出于这个目的,作者们提出了一种新的多智能体的「执行者-批评者」方法:反事实多智能体策略梯度(COMA)。COMA 中使用一个中心化的批评者估计 Q 函数和区中心化的执行者,从而优化智能体的运行策略。除此之外,为了解决多智能体间互相建立信任的问题,它使用了一个会把单个智能体的动作边缘化的反事实基准线,同时还能保证其它智能体的动作不变。COMA 中使用了一个批评式的表征,从而使得这个反事实基准线可以在单个前馈流程中进行高效的计算。作者们在星际争霸游戏的单位控制测试环境中评估了 COMA 的表现,使用了非常便于分别观察的去中心化变量。与这个环境下的其它多智能体执行者-批评者方法相比,COMA 的平均表现有显著提高,而且 COMA 得到的最好的智能体的表现可以和顶尖的具有全状态数据的中心化控制方法相提并论。
论文地址:https://arxiv.org/abs/1705.08926
杰出学生论文提名(这一奖项在现场没有颁布)
《Adapting a Kidney Exchange Algorithm to Align with Human Values》改造出和人类的价值一致的肾脏分配算法
作者:Rachel Freedman,Jana Schaich Borg,Walter Sinnott-Armstrong,John P. Dickerson,Vincent Conitzer
论文摘要:如何高效分配有限的资源是经济学和计算机科学两个领域共有的经典问题。对于肾脏移植手术来说,通常会由一个中央市场把一切正常的肾脏捐赠者分配给等待肾脏的病人。在肾脏分配中,病人和捐赠者首先由委员会通过特设的权重决定优先级,然后输入一个分配算法,由它决定哪个病人会分配到哪个捐赠者——以及决定哪个病人分配不到捐赠者。在这篇论文中,作者们提出了一种端到端的方法用于在肾脏分配中根据每个病人的档案估计权重。作者们首先从人类被试者获取了一组他们认为可以用于决定病人优先级的属性(比如医疗特征,生活方式等等)。然后作者们根据不同病人的档案向被试者提问对比问题,并根据他们的回答严格地计算出各个属性的权重。作者们展示了如何在肾脏分配市场的分配算法中使用这些权重。作者们接着在模拟环境下评估了这些权重的影响,发现他们算出的权重的精确值其实影响很小,实际上需要的只是由权重计算出的档案的排序。不过,与完全不给病人排优先级的情况相比,带有权重的算法还是取得了更好的表现,确实有部分类别的病人从前述的测试者的价值评价中获得了优先匹配(或者延后匹配)。
论文地址:https://users.cs.duke.edu/~conitzer/kidneyAAAI18.pdf
AAAI 2018 的杰出高级程序委员(SPC)奖项颁给了 Jörg Hoffmann 教授。
Jörg Hoffmann 教授是德国萨尔兰大学数学和计算机科学院长,领导人工智能集团基金会(FAI)。他在弗莱堡大学获得博士学位,他的主要研究领域包括和 problem solving 有关的一系列话题,特别是组合搜索问题的建模和解决方案。主要研究领域包括自动化规划,SAT / CP,模型检查,语义 Web 服务,业务流程管理,马尔可夫决策过程,自然语言句子生成,模拟网络安全渗透测试等相关领域。
AAAI 2018 的 20 位杰出程序委员(PC)获奖名单如下,其中,Haiping Lu(吕海平)和 Xiangyuan Lan 为获奖的两位华人。
吕海平目前在英国谢菲尔德大学担任机器学习领域的讲师,于 2008 年获得多伦多大学电子及计算机工程博士学位。他的主要研究领域包括: 模式识别,机器学习;多元统计分析,张量计算;图像处理,视频处理;生物识别,生物医学工程等。于 2013 获得 IEEE 杰出博士论文奖,2014/2015 年香港研究资助局 Early Career Award。他曾先后担任 ICML-18, AAAI-18, NIPS-17, AAAI-17, AISTATS-17, NIPS-16, IJCAI-16 的组委会成员,也是 IJCAI-18 的高级组委会成员。
蓝湘源目前在香港浸会大学担任博士后研究员,研究兴趣包括计算机视觉和模式识别问题的稀疏表示和深度学习。2012 年毕业于华南理工大学计算机科学系,2016 年在香港浸会大学获得博士学位。他曾在 2015 年担任美国马里兰大学的访问学者。
每篇论文在现场有三分钟的展示时间,经过激烈角逐,Ellis Hoa 和 Janardhan Doppa 的 poster 论文《Bayesian Optimization Meets Search-Based Optimization:A Hybrid Approach for Multi-Fidelity Optimization》获得了 AAAI 2018 的最佳学生论文展示奖。
以上便是 AAAI 会议奖项的全部内容。四篇最佳论文及提名论文将会在接下来两天陆续进行展示,敬请期待雷锋网 AI 科技评论带来的后续报道。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。