当前位置:首页 > 资讯 > 正文

人工智能,国际仲裁效率的驱动力—预测性编码如何改变文件出示?

人工智能,国际仲裁效率的驱动力—预测性编码如何改变文件出示?  第2张

导言

在过去几年中,国际仲裁界已开始就争议解决的数字化转型和人工智能展开讨论。学者和仲裁从业人员一直在推测如何在仲裁程序中使用人工智能,以及从司法角度来看,人工智能可能对仲裁程序产生怎样的潜在影响。到目前为止,这些讨论几乎完全集中在(近期和远期的)未来,而未关注当下。关于国际仲裁中使用的人工智能工具的现状,人们很少提及。

Claire Morel de Westgaver和 Olivia Turner于2020年2月23日在Kluwer Arbitration Blog上发表的一篇文章,就国际仲裁中目前正在使用的一项人工智能技术——预测性编码(predictive coding)进行了有益的探讨。为学习交流之目的,我们对此进行了编译,以飨读者。如有侵权,请及时与我们联系。

预测性编码的应用

目前用于纠纷解决的人工智能工具之一是预测性编码。预测性编码是一款有人工监督的机器学习工具,它能获取基于人工审阅的、关于文件相关性的输入数据,并将其应用于审阅更多的文本量。通过预测性编码,“相关的”或者“响应的”文件可以被算法识别。预测性编码在英国的法院诉讼中已使用多年,Brown v BCA Trading Ltd [2016] EWHC 1464(Ch)案是第一起申请使用预测编码的案件。美国法院也允许使用它,其中一些法院已经认识到,预测性编码审阅文件的结果在统计学上优于传统的人工审阅(Moore v Publicis Groupe 11 Civ 1279(ALC)(AJP)II Civ 1279(ALC)。

相比之下,在仲裁程序中使用预测性编码的程度以及应如何使用该技术尚不清楚。2018年玛丽女王大学的调查显示,5%的受访者经常使用人工智能(包括数据分析和技术辅助下的文件审阅),3%的人一直使用人工智能。然而,在仲裁程序的各个阶段,当事人之间或与当事人和仲裁庭之间都很少讨论使用预测性编码的问题,目前也没有关于这一问题的仲裁规则和非常好的实践指引。例如,IBA Arb 40指导委员会关于仲裁从业人员技术资源指引(Guide on Technology Resources for Arbitration Practitioner)确实提到了预测性编码,将其列入了可用于文件审阅的各种软件工具的列表之中。但是,该指引没有涉及预测性编码是否可以在仲裁中使用的问题,以及如果可以,在什么条件下方能使用该技术,包括向对方当事人和仲裁庭披露和征得同意方面的问题。

这篇文章讨论了预测性编码可能如何影响国际仲裁中的文件出示(document production),以及就其使用、披露义务和案件管理方面需要的指引。

预测性编码如何运作

第一步是设置参数,并识别待审核文件的样本集。该份样本集通常由熟知案件情况的资深律师审阅。审核员按照“相关的”(relevant)“不相关的”(not relevant),或“响应的”(responsive) 或“不响应的”(not responsive)等分类指标,对文件进行编码,从而训练预测公式(即,算法)。

该算法将连续地或在样本集审阅完成后,应用于全部文件的审阅。算法会识别“相关的”或“响应的”文件,并按相关性/响应性顺序排序。资深律师可进一步审核更多的文件以改进算法。这些文件包括工具标记为算法和人工审核员处理不一致的文件。人工审阅将持续进行,直到达到可接受的置信度和响应分数为止。在此阶段,将对算法确定为无关/无回应的文档随机抽样以进行质量控制。

追求效率的动力

仲裁规则和仲裁法既不涉及人工智能,也不涉及应以何种可接受的方式,回应对方当事人查阅文件的请求的和/或仲裁庭有关查阅文件的命令。除了某些仲裁制度所规定的诚信义务外,也没有明确的标准来判定一方当事人是否履行了其查阅文件的义务。

但多数主要机构的仲裁规则和仲裁法都鼓励仲裁庭以及当事人采用高效率、低成本的方式进行仲裁。这暗含了电子工具的使用:许多仲裁指引也鼓励使用电子工具,比如,国际商会委员会关于电子文件管理的报告(ICC Commission Report for Managing E-Documents)和英国特许仲裁协会关于仲裁中电子披露的协议(CIArb Protocol for E-Disclosure for Arbitration)。《国际律师公会国际仲裁取证规则》(IBA Rules on the Taking of Evidence in International Arbitration)第3.3 (a)(ii)条也体现了应高效检索相关文件的思想。

为什么在国际仲裁中使用预测编码

预测性编码可能比基于检索词的人工检索更有效。法律团队的成员只需审查被算法确定为“相关的/响应的”文件(以及随机抽取的“不相关的/不响应”的文件以进行质量控制),不再需要手动翻阅某些文件保管人文件夹中的文件、以及在特定日期范围内或通过检索词进行筛选的文件。2011年的一项研究表明,使用预测性编码技术比人工查阅文件节省了大量成本,因为“技术辅助审阅平均只需要人工审阅1.9%的文档量,比完全的人工审阅节省了50倍”。

预测性编码通常可以实现较高的一致性,因此错误风险较低(这两者的数值都可以从一开始就设定)。大多数情况下,预测性编码与关键词搜索结合使用。由于需要人工审阅的文件较少,因此人工审阅通常由一名律师而不是由一组不同的律师进行。这不仅降低了成本,而且将审阅限制在一个或少数几个更有经验的审阅者之中,会提升审阅文件的一致性和质量。

一些研究实际上已经得出结论,预测性编码往往比人工审查更准确。2010年的一项实证调查显示,两个计算机系统(由两个不同的提供商提供)的表现至少与人工审查的准确性一样。

量化风险

一些仲裁从业人员对使用预测性编码来审阅文件,以回应另一方当事人的文件请求(document request)表示担忧。他们的担忧是,这些响应的文件是通过算法,而不是人工审阅搜索到的。的确,文件开示义务通常受到道德准则的约束,而算法和软件不受此约束。这就提出了一个问题:谁应该为算法的错误负责?

当然,特定的算法可能会错误地将文件识别为相关/回应文件,或者更有问题的是,错过了相关/回应文档。算法的准确性和错误风险实际上构成了任何预测编码工具的一部分。有关查全率、准确性和潜在错误的数据可以在审核的不同阶段统计。尽管这些统计数据确实反映了存在出错的风险,但这些数据也让使用预测编码的当事人理解了风险,并且可以量化该风险。如果双方当事人共享使用预测编码,则双方当事人和仲裁庭都可以了解错误风险的大小。传统检索词或人工审阅却无法做到这一点。

传统的审阅方法实际也存在错误的风险,只是这些风险并没有被考虑或量化。人的错误很少在仲裁程序中被发现,因此与人相关的错误的风险可能被低估。在文件审阅中将人工智能与人工查询的结果进行比较时,这可能会改变一般的看法。基于检索词的审阅也有很大的潜在错误率。有些文件请求很难通过检索词搜索。例如,检索词可能无法成功地抽取与抽象或消极概念有关的文件,例如不公平偏见或一个实体对另一个实体是否存在控制权。预测性编码特别适合于这些类型的文件请求。

披露、同意和裁定预测性编码

在交换文件请求之前,可能尚不清楚在具体的仲裁中是否需要预测性编码。但这并不意味着在庭前会议之前或过程中,预测性编码这一问题不能或不应该提出。在这一阶段,双方当事人可以约定,和/或仲裁员可以命令,打算使用预测编码的一方当事人应向另一方当事人披露和/或寻求仲裁庭的许可。披露将确保另一方当事人和仲裁庭有机会提问,并确信预测性编码是以适当方式使用的。这也将避免有关“使用预测性编码和(或)未披露其使用构成程序违法和撤裁的理由”的主张。如果在仲裁后期,甚至在裁决作出之后提出这一主张,将使预测性编码从一种节省费用的手段变为一种浪费费用的手段。及早就这一问题进行讨论可以避免这一主张,或至少使仲裁程序更有说服力。

对预测性编码的披露和/或对使用预测性编码的许可,同样可能影响到与预测性编码相关的成本是否可作为胜诉方成本的一部分进行追偿。

如果仲裁中采用预测性编码并作了适当披露,可能会讨论的是需要人工审阅的文件数,以及算法的准确性,因为这两个因素都与文件遗漏的风险程度有关。使用预测性编码的一方也应当报告为训练算法而需要的人工审阅文件的数量。如当事各方不能达成协议,仲裁庭将需要对这些问题作出裁决,作为其处理程序和证据事项的一部分。

结论

是否使用预测性编码,最终还是由当事人决定。但是,当事各方、律师和仲裁员应了解这一技术在仲裁程序中的存在和适用。除了人工智能发展所带来的有趣的政策考量之外,从业人员可能希望增加他们对预测编码的实际理解,因为他们将来可能需要解决这个新领域。这可能是为了确保仲裁庭下达的文件开示命令将会或者已经得到遵守,或者是为了推动己方或反对另一方寻求仲裁庭许可使用预测编码的申请。此外,鉴于国际仲裁文件不断增加,以及不可否认的预测编码能够节省费用因素,越来越多的律师会期待使用预测性编码,并就如何战略性地使用该技术向客户提供建议。

信息源于:环中商事仲裁