汤森路透法律信息集团,是全球最大的法律专业书籍出版商,旗下拥有多家在业界德高望重的法律出版公司,出版物内容几乎覆盖普通法系和大陆法系的所有领域,是法律出版行业的巨头企业。Westlaw则是汤森路透依托业界专家和核心法律研究工具,为法律工作者创建的一站式法律信息检索平台,以海量的英美法国家原始法律资料以及二次法律资料为基础,自1975年开发以来一直是法律检索领域中的龙头产品之一。
ROSS则是大名鼎鼎的“全球首款机器人律师”,该项目于2014年通过IBM竞赛项目孵化,以“法律+人工智能”而著称。2015年,便获得大成律师事务所旗下的NextLaw Labs的投资,正式成为大成的业务伙伴。2016年ROSS还以“机器人律师”的身份入职国际大型律所Baker and Hostetler。2017年,ROSS获得了870万美元的A轮融资。
那么汤森路透作为传统法律检索行业的巨头,为何突然选择起诉ROSS这一法律科技行业的新兴力量呢?原因就在于ROSS对汤森路透旗下产品Westlaw数据的获取与使用。
在起诉书中,汤森路透指控ROSS在产品研发的过程中,在没有授权的情况下使用Westlaw数据库的West Key Number System以及West Headnotes产品,构成对Westlaw数据库的专有数据的窃取。除了侵犯著作权外,该索赔还声称ROSS严重侵犯了西方出版公司与LegalEase的合同。
针对汤森路透的起诉,ROSS的联合创始人Andrew Arruda发长文进行了回应。Andrew宣称,“这一起诉并不是为了保护专有数据,而是为了保护Westlaw的市场份额。汤森路透的指控是没有丝毫根据的,我在发文中用无可辩驳的证据说明了这一点。”
双方争议的焦点,在于ROSS通过第三方LegalEase获取Westlaw中的数据,是否构成侵权。
汤森路透声称,ROSS在被禁止以竞争对手的身份访问Westlaw数据库的内容的情况下,通过与第三方LegalEase公司合作,故意诱使其违背与原告的合同,非法复制原告受著作权保护的内容,并将该内容大量传递给ROSS。以这种方式,ROSS“非法且秘密地”使用第三方的许可权限,通过复制、使用基于Westlaw数据库的专有数据的衍生内容,对原告实施了直接的著作权侵犯。
而Andrew则在其回应中首先对ROSS与LegalEase的合作关系进行了澄清。他指出,从2017年开始,ROSS与LegalEase进行合作,合作内容是从LegalEase处获取原始的裁判文书,来构建人工智能系统的训练集,实现将法律问题直接映射到案例文书中回答这些问题的段落的功能。在2018年,Westlaw对LegalEase提起诉讼,声称LegalEase以标题、案例摘要和其他编辑过的内容的形式为ROSS提供了专有数据。然而,ROSS从未要求或使用Westlaw的专有数据,因为ROSS不能将这些专有数据映射到数据库的裁判文书中,且其产品也不是通过生成经过编辑的答案这一传统方式,而是通过机器学习技术直接从判例法中提取答案。因此,ROSS对Westlaw加工过的专有数据并没有需求。
为了进一步说明ROSS并无意使用Westlaw的专有数据,Andrew在文中公开了ROSS的项目负责人与LegalEase的主要联系人的往来邮件。邮件内容显示,当LegalEase确实向ROSS发送了包含加工过的标题、脚注和其他内容的Westlaw专有数据时,ROSS的负责人向对方表示,“如果您可以在没有这些额外信息的情况下向我们发送案件,那将非常好。谢谢。”
而在数据获取这一基础问题之外,双方不约而同地将本次诉讼上升到了市场竞争的高度。
汤森路透指出,ROSS所提供的人工智能法律研究服务,需要大量的法律内容的原始信息、描述以及分类,这对他们来说需要很高的成本。同时,ROSS知道他们不可能以这样的理由获得Westlaw的授权,因此与第三方LegalEase合作,使用Westlaw给予LegalEase的授权,来获得Westlaw所收录、整理、分类的数据。而在这一使用过程中,ROSS既没有获得Westlaw的授权,也没有对Westlaw进行赔偿。这一行为的直接结果就是,原告在完全不知情的情况下,帮助ROSS创造了他们的产品,从而在市场与原告的Westlaw进行竞争。
对此,Andrew在回应中表示,“汤森路透是在用诉讼作为武器,来干预ROSS获得投资、与其他公司合并的机会,从而打压ROSS在与Westlaw竞争中的实力。”在文末,Andrew强调,ROSS的使命就是通过更好的法律技术让法律民主化,这一点与Westlaw主导的法律研究市场的现状形成了剧烈的碰撞。他将这场诉讼比作是大卫与巨人歌利亚的对抗1,,并援引美国最高法院在“Georgia v. Public Resouce.Org, lnc,”这一案件判决中“没有人可以拥有法律”的原文,表示要与Westlaw抗争到底。
注:歌利亚是传说中的著名巨人之一,《圣经》中记载,歌利亚是非利士将军,带兵进攻以色列军队,他拥有无穷的力量,所有人看到他都要退避三舍,不敢应战。最后,牧童大卫用投石弹弓打中歌利亚的脑袋,并割下他的首级。大卫日后统一以色列,成为著名的大卫王。
法律分析
根据目前已知信息来看,汤森路透起诉ROSS的案件中可能涉及著作权保护与数据不正当竞争这两个法律问题:
1. Westlaw数据库中的裁判文书,是否受著作权保护?
在美国,对法律文书类作品著作权的限制主要遵循这样的规则:职责范围内的官方法律文书类作品无著作权保护。根据美国现行的1976年《著作权法》的规定,著作权保护不适用于任何美国政府作品,即由美国政府官员或雇员在其职务范围内制作的作品。这里的“政府”(the United States Government)一词,指的是联邦政府,而不包括州政府和地方政府。因此,美国联邦法院的裁判文书属于美国政府作品,不受著作权保护,这是肯定的。
而在州法院的层面上,各州政府的观点不一,甚至出现了截然相反的立法。然而在司法上,大多数法院意见比较一致,出于公共政策的考虑,认为州法院裁判文书和联邦法院裁判文书一样不受著作权保护。在1888年联邦最高法院审理的Banks v. Manchester案中,联邦最高法院认为,根据公共政策原则,法官的所有工作形成了对法律的权威说明与解释,约束着每个公民,应当向所有人免费公布,因此无论是州政府、州最高法院,还是出版社,都无权声称对法院裁判意见享有著作权。从本质上来看,对Banks一案中确立的这一规则,应以民主法律性质的基本原则为基础来进行理解。在民主统治下,人民是统治者,借助立法代表和司法代表来管理自身,故立法人员和司法人员只是法律的起草者,是人民的公仆,人民才是他们所产生成果的真正作者。因此,裁判文书的著作权不能属于特定人,只能属于全体人民。
在我国,法院裁判文书同样不受著作权保护。根据《著作权法》第5条第1项,“本法不适用于法律、法规、国际机关的决议、决定、命令和其他具有立法、行政、司法性质的文件,及其官方正式译文”。我国法院的裁判文书,作为法律适用的结果,对公民具有约束力,属于“具有司法性质的文件”,因此同样不受著作权保护。
2. ROSS使用LegalEase从Westlaw数据库收集的数据,是否构成不正当竞争?
在美国司法实践中,涉及企业间数据不正当竞争的纠纷,主要体现在两大领域,一个是早期在新闻领域由“盗用理论”规制的数据不正当获取与利用行为,另一个则是当前在“网络爬虫”领域的数据不正当获取与利用行为。
“盗用理论”源于1918年美国联邦最高法院审理的“International News Service v. Associated Press案”,在该案中,美国国际新闻社(简称国新社)贿赂美国联合通讯社(简称美联社)的员工从而获取还未发表的新闻作品,或者直接从美联社的布告板上复制、改写新闻加以发表。在该案中,美国最高法院认为事实数据并不存在著作权,但美联社在涉案材料的获取上投入了劳动、技能、金钱,并通过出售加工后的新闻材料进行营利,对这些材料享有财产利益,可以阻止竞争者的不当利用、盗用。同时,最高法院还提出了盗用理论适用所需的三个条件:未经授权、明知所利用的产品来自合法竞争者的劳动、目的在于减少竞争者的利益或增进自己的利益。
在美国第二巡回法院1997年审理的“NBA v. Motorola, lnc.案”中,被告摩托罗拉公司利用一种名叫“Sports Trax”的小装置,发送第二被告Stats公司提供的原告NBA的即时比赛信息。初审法院认定被告的行为构成盗用,而第二上诉巡回法院则进一步对“盗用理论”进行了发展,认为“盗用理论”的适用需要具备“原告为生产或收集信息投入劳动”、“信息具有较强的时效性”、“被告使用信息的行为构成搭便车”、“被告与原告存在竞争关系”和“搭便车带来了实质性的利益损害”五个因素。
我国近年来也出现了大量涉及行业内数据竞争的案例,最早的当属2010年的 “大众点评诉爱帮网系列案件”。在该案中,大众点评指责同为网络分类信息查询服务提供者的爱帮网“大量复制其网站中包括商户介绍、用户点评在内的各类内容”,先后以著作权、不正当竞争为诉由起诉,其不正当竞争诉由最终获得法院支持。法院认为,大众点评网的内容是运用商业方法收集、整理而得,付出了人力、财力等经营成本,由此产生的利益受法律保护。在双方提供服务具有同质性的情况下,爱帮网对这些内容的复制与展示,侵害了大众点评网的利益,构成不正当竞争。
“网络爬虫”领域的数据不正当行为的法律规制,体现于美国1986年的《计算机欺诈与滥用法》(简称CFAA)。CFAA第1030条第a款规定:“未经授权故意访问计算机或超过授权访问权限,从而从任何受保护的计算机获取信息;或者故意造成程序传输,并且对未经授权且受保护的计算机造成损害…须承担民事责任或刑事责任”。然而,相关条文并没有明确“未经授权访问”的具体含义,这一点也成为了相关司法实践中决定裁判结果的关键。
在本次汤森路透起诉ROSS的案件中,ROSS在自身没有获得授权的情况下,从LegalEase这一第三方获取Westlaw数据库中的专有数据的行为,可能可以适用数据不正当获取与利用中的“盗用理论”,被认定为数据不正当竞争。即使如ROSS所宣称的那样,他们使用的只是Westlaw数据库中的原始裁判文书,然而汤森路透的确为收集这些数据投入了劳动,在双方存在竞争关系的情况下,ROSS没有取得汤森路透的授权就使用这些文书数据训练自己的人工智能系统,可能已经构成了搭便车的行为,在竞争中为自己牟利并实质损害了汤森路透的利益。有利于ROSS的因素是,这些法律文书数据是否具有时效性是存疑的。因此,法院如何认定法律文书的时效性,以及时效性这一因素在适用“盗用理论”时是否是不可或缺的,可能将成为本案中认定ROSS是否构成不正当竞争的关键。
小结
这样一场由巨头发起的诉讼对于ROSS这样一个创业公司来说,其成本是相当大的,而若真的败诉,则可能带来更大的连锁反应。
这一案件最终将走向何处,人们可以拭目以待,然而无论结果如何,这一案件本身,对于与众多新兴的法律科技公司而言,都是值得仔细研究的。在法律科技领域中,数据无疑是核心资源。如何能获得更及时、更全面、更准确地获得裁判文书等司法数据,是每个公司团队都在思考的。只有以足够优质的数据资源作为基础,法律科技产品才有可能不断研发、迭代,并最终在市场竞争中脱颖而出。
互联网的开放和效率建立在尊重契约的基础上,在进行数据获取与利用时,法律科技公司要严格尊重在先企业通过成本付出而获得的数据竞争优势,严格遵守robots协议、授权协议、使用协议等,不得不正当地获取、利用他人所拥有的数据资源,否则便有因不正当竞争而被起诉的风险,最终得不偿失。