读论文——An autonomous debating system


“Hi Siri,打开美团外卖。” “好的。”

“小爱同学,我想吃麻辣烫。” “好的。”

在我们的日常生活中,智能语音助手应该时时刻刻站在我们的角度思考,无条件的遵从用户的命令,帮助人们完成任务。然而不知道大家有没有思考过,只会遵从你命令的语音助手真的智能吗?最近一期Nature的封面文章An autonomous debating system告诉我们,对抗性的交流,比如争论、辩论也是人类智能的一个重要组成部分,覆盖了人类众多的日常活动。作者在文章中展示了Project Debater——一个会“抬杠”的人工智能系统。

关于Project Debater

首先因为文章涉及到辩论,我们先了解一下辩论中最主要的的两个专业名词:

动议Motion:也就是论题,你必须根据你队伍的立场来决定是支持还是反对。

论点Argument:每个队伍都需要对动议提出直接的论点,论点包括观点,支撑该观点的证据以及将两者关联起来的分析过程,其结构更像是一篇文章或者段落。

来源

文章介绍了Project Debater是IBM在2012年启动的一个研究项目,最终的目标是和一个冠军辩手进行现场辩论。这也可以说是一场公开的实验,我们一起看看这个实验的形式吧:

  1. 确定辩论动议(Debate Motion),之后双方都可以准备15分钟。

  2. 双方做三段陈述,具体可以看图:

    陈述规则

  3. 观众会在陈述之前和之后分别给正反方投票,能够拉到更多选票的人被视为获胜者。我不懂辩论的规则,我想应该是比谁更能过够改变观众的想法,就是正→反反→正的数量对比。

值得注意的是:

  • 人类选手不是随随便便选的,是曾经获世界大学生辩论赛冠军的选手;
  • 这个实验的“动议”没有被用来构建Project Debater的训练数据;
  • 这篇文章的重点是描述PD在一系列广泛话题上的表现,不局限于这次比赛。

系统架构

一场辩论中AI要完成的任务非常多,端到端的模型在这个场景里就不适用了,那PD是如何应付这些任务的呢?

文章提到的解决方法是将问题分解为并行执行的模块化具体任务,具体可以分为四个模块:

  1. 论点挖掘(Argument Mining)
  2. 论点知识库(Argument Knowledge Base)
  3. 反驳(Argument Rebuttal)
  4. 组织语言(Debate Construction)

论点挖掘 AM

该模型分成两个阶段,线下和线上:

论点挖掘流程

对流程图的说明:

  1. 声明(Claim)指对动议有明确立场的简明陈述;证据(Evidence)指能明确支撑或者反驳动议的一个简单句,用来证明声明是否正确。
  2. 检索算法是为了得到与动议相关的语句;
  3. 排序算法用的是神经网络模型,得到最相关的语句;
  4. 使用神经网络模型和基于知识的方法对语句的立场进行分类;
  5. 1.该阶段包含主题扩展的组件,用以寻找更多与辩论相关的概念;
  6. 在挖掘支持自身论点的同时也会挖掘支持对方的论点,以推理出对方可能会用到的声明或者证据,以便及时做出反应。

论点知识库 AKB

构建论点知识库旨在掌握不同辩论之间的共性,比如有的辩论虽然动议不同,但都是在讨论废除或者保持某项法例,属于相同的主题。也就是说AKB主要的作用是输出核心论点。

AKB中的文本可以是手动构建的,也可以是由机器抽取然后人为编辑的,可以是论点,也可以是引用,甚至是一些修饰性的类比和推理,他们被分成了不同的主题类别

当被提及一个新的动议时,系统通过特征提取器来确定与该动议相关的主题类别,与该类别相关的文本都可以被用到接下来的发言之中,系统会根据他们与动议在语义上的联系来选择最相关文本。

除了应对新动议,AKB还是反驳模块的重要部分。当系统确定了对方表达了某个原则性论点,可以借助AKB来将这个论点映射为反驳他们的反论点。AKB中还包含了许多辩论中常见的情感术语,比如“有害的”,借助基于模式的方法,系统可以反驳聚焦于这些术语的论点。

可以说论点知识库是PD的小抄,密密麻麻的记载了各种话术、各种主题的辩论案例。

反驳 AR

构建反驳的流程

就和上文提到的一样,构建反驳时参考了AKB中的一些关键性的语句,用来做为生成反驳的线索。但到了这一步,系统还不能够输出完整的反驳语句,需要进行最后一步,也就是组织语言。

组织语言 DC

组织语言虽然容易让我想起这个表情包组织语言但是我真的找不到更合适的词了。

这样讲可能还是不太清楚,文章中给出了一个实际例子:

该系统的发言流程

总结与思考

  • 总结一些Project Debater的四个模块:

    我觉得前三个模块分别对应了辩论中三个比较重要的因素:

    1. AM从大量的语料中获取论点,是一个以海量数据为基础的模型;
    2. AKB主要作用是确定辩论的核心论点,避免出现大方向上的错误,当然也能帮助发现对手的错误;
    3. AR是攻击对手的主要手段。

    当然光会这些技能是不够的,还得会巧舌如簧才能说服观众。

  • 实现Project Debater有哪些难点?

    1. 论辩结构非常复杂和微妙,有时还很晦涩,不像句子结构那么容易识别;
    2. 在真实世界中,论点没有清晰的边界,存在着互相引用、类比等等复杂且庞大的网络。
  • 尽管Project Debater还是一个初级辩手,但它已经是在自然人类语言中识别论点这一领域的重大进展了!

“Hi Siri,打开美团外卖。” “你都这么胖了还吃外卖。”

“小爱同学,我想吃麻辣烫。” “我觉得你应该吃点更健康的食物。”


文章作者: Hank
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Hank !
评论
  目录