论文阅读 - Departures from Tree Structures in Discourse - Shared Arguments in PDTB
为了更好地搞清楚自己究竟读过哪些论文,于是决定为读过的论文写一些笔记。这是第一篇笔记,关于 PDTB 中树结构的构建问题。
1.概述
这篇文章关于 Discourse Structure,是指任何超过句子结构以上的结构。尽管在大多数时候,DS 都可以被放在一个树地结构下,但是存在这样一个结构:两棵树会存在交集的情况,即存在一个“daughter”被两个 root 管辖。这篇文章将关注点放在“the shared discourse structure is a syntactically subordinate clause introduced by a subordinating conjunction”。
关于上述定义:
- syntactically subordinate clause:是指语法上的从句结构
- subordinating conjunction
- 从属连词,a connecting word or phrase that introduces a dependent clause and joins it to a main clause or independent clause.
- 常常被用来加上时间、让步、对比、因果等等条件
- 从属连词必须放在 dependent clause 的开头
- 例子:because, before, when; even though, as long as, except that
这篇文章考虑的是,从属句可能会作为另一个 DS 的一个 Argument,并暗示了 Syntactic subordication 及 DS 的关联。这篇文章的主张是:尽管在大多数时候,SS 和 DS 是对应的,但是有一些例外的存在。这里讨论这些例外,以及它们的意义。
2. 背景
a subordinating conjunction is a grammaticization of the rhetorical organization of discourse
一般认为 Sc(subordinating clause)和其他 non-salient discourse 一样,对主题的连续性无关。这些成分被认为是句子的背景,但是他们本身并不能使主题更进一步。依据这种思路给出了做 Summarizer 的思路:移除所有的 non-salient 部分即可以完成概括。而有人指出,Sc 只是作为一个造成 discourse saliency 的原因。
这篇文章会通过经验上的方法,去检验句法和篇章之间的关系。
3. 方法及发现
考虑这样一个句型:”X although Y”,其中 X, Y 是 although 的两个 arguments,Y 是从句,假设标注者并不知道这个句子的关系的情况下,遇到了另外一个句子,这时候我们关心的是,Y 是否被选出作为另一个 DS 的一个 argument。
The London index finished 2.4% under its close of 2233.9 the previous Friday, although it recouped some of the sharp losses staged early last week on the back of Wall Street’s fall. London was weak throughout Friday’s trading, however, on what dealers attributed to generally thin interest…(1505)
在这个例子中,although 是第一个 ds 的一个 argument,同时也是第二个句子的一个 argument。为了方便我们称呼由 however 引导的这个 ds 为 external relation。在 PDTB 中,这样的 subordinating conjunctions 还有 after, although, as, because, …共计 12 个最为常见。在所有的情况中,以全句作为 er 的比例是最高的;其次是使用 matrix clause;最其次是使用 sc 作为 argument。而使用 coordinating conjunctions 作为对比则可以发现,其后两类的比例是几乎一样的。
it does seem to be the case that there is a correspondence between syntactic
coordination and subordination on the one hand, and symmetric or asymmetric salience of discourse arguments on the other
几乎可以认为,sc 的 saliency 低于 matrix clause。因此,认为语法和 ds 相关的观点是可以成立的。
4. 讨论
几个例子:
They won’t buy if the quality is not there. Or if they feel the wine is overpriced. (0071)
这个例子特殊在,尽管”the quality is not there“是一个 sc,并被 Or 判定为 er,但是可以发现整个句子是以 if 作为基础的,这样的例子可以使用树状结构加以概括。这和前文出现的例子不一样,前文的例子是一些并列的关系。于是可能在没有出现明显的嵌入的情况下,我们认为把 discourse 放入某些树结构中没有太多价值。
上述式子可以概括原句。我们给一个新的例子:
我们认为 Y 延续了这个 DS,而再上面那个例子没有。(5i)这样是符合预期的,因为我们不希望一个 sc 去作为句子的主要成分并 continue 一个 DS。而(5ii)则更有意思。所以在什么情况下,一个 sc 会变成推动句子发展的 salient clause?下面是文章的作者们做的一些观察(文章作者声称自己并不仅仅是做观察,并会将系统的分析留到将来数据集更完善的时候(感觉这是我的锅了))。
首先,有两种固定的模式:
- 这个 sc 总是后置的。例如”The dilligent boy passed the exam because he studied hard“,前置或者居中的 sc 是不行的。
- er 总是限定在 - 对比、因果这样的关系中,而例如并列这样的关系则没有。
以及一些大概率的模式:
- Anaphoric matrix clause:这个 matrix clause 在原文中有一个很明显的前指。
- Reduced matrix clause:通过代词等短句很简单地指向了前文。
it may be because these shows need all the protection they can get. (Implicit-CAUSE) European programs usually target only their own local audience, and often only a small portion of that. (2361),对应第二种模式
在上述的情况中,主句总是在前文中有一个前置。可以认为是前置提供的信息削弱了后面主句的 saliency,使得 sc 上位。即,如果主句更多的是在照应前文的观点,则使得其从句更加自由,便可以作为承接下文的句子。
- sc 被一个”coordinating-type“的 subordinating conjunction 引导:特别的,这里指两个词:although和because。这两种词引导的句子经常被用作 external argument,在发现的 349 例中,有 189 例归于上述两个中的一个。
所以是否在 DS 中使用树结构,还是说在 DS 下使用树结构只是从语法分析上遗留下来的策略?