洞察详情

AI领域的热点知识产权问题与风险防范


近日,盈理律师事务所(下称“盈理”)资深顾问、数据合规研究院院长赵军先生受邀参加《追AI的人》系列直播,并分享《对人工智能产业发展四大要素的保护——数据与知识产权的挑战与实践》。


《追AI的人》系列直播是一档由阿里巴巴人工智能治理与可持续发展研究中心(AAIG)联合高校和产业界发起的AI治理交互栏目,重点关注并分享人工智能新技术、AI治理新观点、可持续发展新风向。


人工智能不仅带来了商业模式的变革和新的市场机会,同时也带来了新的法律风险。AI的技术创新成果是否可以通过现有的知识产权法律制度予以保护,高额的研发费用是否可以转化为市场的竞争优势,何种方式才能最大程度的维护AI企业利益,将是本课程首先要解答的问题,为什么商业秘密是一种有效的维权手段,如何运用好这一法律武器,又如何防范相应的法律风险?赵军先生在本次直播课程中都作出了深入浅出的分析与解答。


本文分为上、下两篇,此为下篇,主要整理分析了“AI领域的热点数据合规问题与风险防范”问题。


一、AI领域的著作权和专利热点问题简介///



我们知道人工智能产业发展有4大要素,一个是随着大数据的发展,随着计算能力的突飞猛进,结合算法的创新,形成了人工智能产业的发展。客观来讲人工智能的发展也确实带给知识产权很多挑战。


知识产权的法律制度成熟于18世纪,那时候工业革命是一些机械物理的,包括像蒸汽机器这一类的发明创新。现代知识产权制度是在这样一个背景下产生的。但是时间发展到数字经济,特别是人工智能发展起来之后,它的经济基础发生很大变化,作为知识产权制度,相对来讲还是出现了一定的滞后。


如何用知识产权制度来维护和保护好人工智能领域的创新,也带给知识产权一些挑战。下面我将从数据、算力、算法和人工智能的产物,这四个方面跟大家分享人工智能领域的知识产权和数据方面的问题,以及相关的风险防范。


概括说来,人工智能需要大量数据来供给,通过算法得到想要的结果。数据对人工智能产业是一个非常重要的生产要素。目前来说,我们国家对于数据目前以网安法、数安法和个人信息保护法为代表,主要围绕着数据合规。另外对于某个企业通过提供APP或者提供一些传感器,收集到的大量数据如何去保护?目前来讲在法律的立法层面来讲还是有缺失的。所以对于数据集的保护,我后面也会介绍到它也存在一些争议和问题。


算法这块主要涉及到深度学习,那么这些算法如何保护?目前来讲有三大手段,比如说专利版权和商业秘密,但也确实都各自存在一些问题。另外对于计算能力来讲,它主要通过专利制度来保护。对于最后一部分关于人工智能的产物,现在随着人工智能发展,比如说新闻稿,绘画作品,甚至小说都可以由人工智能来完成。在某些领域,比如制药领域,人工智能还能够帮助筛选一些候选化合物或者一些基因来进行研发。在这种情况下,人工智能自己产生的作品也好,发明创造也好,能不能够用现有的知识产权来予以保护,是一些非常大的问题。


二、AI领域的著作权和专利热点问题简介///



在著作权领域,主要涉及三方面问题:数据保护、算法保护、以及人工智能产物的保护。首先在数据本身的保护方面,我们现有的法律制度是有一些缺失的,一是我们对于这种大数据的保护非常缺失,现有的著作权制度可能更多保护一些小数据集。


在我国,如果数据条目的筛选、编排符合独创性,是可以用版权来保护的。在欧盟有专门的数据库指令,它对其中那些有独创性的数据,可以用版权的方式来保护。但是大量的数据其实是不符合独创性的。这种情况下,欧盟的所谓数据库指令又创设了一种新的模式,叫特殊数据库权,也能进行保护。所以,看起来数据保护在欧盟有数据库指令,在我们国家有版权,但是其实在实践当中并不是特别的好用,原因是什么?


首先,在我们国家,很多的数据很难满足独创性的要求。另外大量的数据是流动性质的,但版权相对来说要有一个比较明确的边界,所以在这种情况下,完全借助版权对数据进行保护还是有很大缺陷。


其次,对算法的保护,比较成熟的是计算机软件的著作权保护。但是著作权保护它又存在一个问题:它只保护表达形式,它并不保护背后的思想。比如说软件,为什么要写成这样,逻辑是什么?第一步做什么,第二步做什么?流程是什么?如果我看懂了你的逻辑,你的背后设计软件的思想,我完全可以另外写一套代码,这样的情况下我就不会侵犯你的版权,因为表达形式不一样,虽然可能思路差不多,但是受到这种方面限制,著作权来保护,也存在一定的缺陷。


对于人工智能的生成物,比如通过人工智能自动写新闻稿,甚至做曲子、绘画,虽然现在人工智能已经能够达到很高的水平,可能很难分辨这篇新闻稿是由人工智能来写的。那么对于这些人工智能自动生成的这种作品,能不能够用版权来进行保护?


这里边其实遇到了两个方面比较大的挑战,一个是说作品要满足独创性,通过既有的素材,通过一些算法自动合成,是否满足独创性,在学术界是有争议的。另外一个更重要的问题,就是版权一向是保护由自然人创作的作品。人工智能不是自然人,是一个机器,是通过算法来完成的,不是一个人来创作的,这种情况下,生成物能够通过著作权来保护吗?


• 例子一:这张图片是一张猴子的自拍照。当年有一个摄影师去拍这些猴子,其中有一只小猴就学会了怎样用照相机,结果它就拿照相机给自己拍了很多照片,后来摄影师就把这些照片放在了网上,大家很追捧,于是就有一些网站用了他照片,但没有给摄影师付费,这个摄影师就去告这些人侵权。这个过程中就引发了一个问题:照片是猴子拍的,版权是否应当归这只猴子所有。美国有动物保护组织还宣称说版权就应当归猴子所有,我可以替代理猴子收版权费,甚至还打了一场官司。当然最终美国法院认定版权还是应当由自然人创作,猴子是不能够享有版权的,但是也判定说摄影师应当把得到的版费要拿出1/4来去保护这些猴子。从这个角度来看,所谓的人工智能生成物能不能够用著作权来进行保护,显然是不行的,因为版权只保护人完成的作品。


• 例子二:两个真实的案例都是在2019年发生,一个叫做百度案,一个叫做腾讯案。这两个案子客观反映了我们国家司法界对于人工智能生成物的争议,百度案子的案情是原告发了一篇文章,这篇文章由人工智能生成的,百度就在网站上进行了转载,后来原告就告他侵权,被告就说这个不是人做的,不应该享有版权。因为它不构成作品,既然不是作品也谈不上著作权的侵权。后来北京知产法院就认为作品这是应当是由个人来创造完成的,因此这个内容不构成作品,但是又认为对于软件的使用者应当赋予相应的权益。也就是人家利用软件生成的内容虽然不构成作品,但是应当给予他相应的权益。这是北京知产法院的一个裁判要点。


深圳的腾讯案也是类似的。一个叫dreamwriter的人工智能写了一篇财经报道类的文章,被告没有经过许可就在其网站转载。于是原告就认为构成了版权的侵权,法院的判决最后跟北京法院还是有一些区别,一个他首先认为从客体的角度来讲,这篇文章虽然由人工智能完成,但是它还是源于了创造者个性化的选择和安排,它满足了独创性的要求,因此涉案的文章它属于一个文字作品,就是他认可了它是著作权保护的课题。另外一个他回避了人工智能本身能不能够作为完成作品的人,而是认为说这个文章它是由原告主持的,多个团队多人分工形成的一个集体的智力创作,是原告主持创作的法人作品。换句话说,深圳法院认为原告就是把人工智能当做一个工具,由一个企业运营完成的职务作品,因此作品应当由法人所有,因此法院认为这侵犯了版权。


学术界也还是存在很大的争议,但至少我们从司法界的这两个类似的案情,得出了不同的结论,虽然两个案子看上去长得很像,但是这个作品完成的过程中,人介入的程度,以及作品所依赖的算法都不太一样,所以在这种情况下也不能说相同的案情得到了不同的结论。因为人参与的程度,将影响如何认定作品是由谁来完成的,是完全由自然人完成的,还是完全由人工智能完成的,还是两者结合一起完成的。作品如果由人工智能+自然人共同完成,则仍然可以认为是自然人完成的,是可以受到版权的保护的。


(一)热点专利问题

关于专利方面的问题,对于算法,虽然我们说专利是可以保护技术方案的,但是专利对于算法或数学模型又存在一个很大的障碍,障碍大概是三个方面:


一个是我们的专利制度,它保护的客体一定是技术方案,换句话说,如果不是技术方案,只是一个数学的算法,或者是一种人思考问题的方法,它可能会被归为智力活动的规则,而不能受到专利法的保护。


一个是专利制度的客体问题,是在专利法第二条所规定的,只能保护有创新的技术方案。那么涉及到算法和数学模型,如果创新只是一种算法,只是一种数学模型,而没有跟技术相结合,那么很有可能它是不能够满足所谓的专利法意义上对保护客体的要求。


最后一个是在进行专利的实质性审查过程中,要进行新颖性、创造性和实用性的判断,特别是在新颖性创造性的判断过程中,就要看你的创新点到底在什么。如果创新的点就在于智力活动的规则,或者就在于算法本身或者数学模型本身,而没有跟技术方案或者技术手段形成互动,那么这种情况下,那极有可能他会认为没有做出创新,就是在专利法意义上没有做出创新。因为如果创新的点仅在于智力活动的规则,那就没有办法获得专利权。


所以在人工智能领域,算法、数学模型一定要跟技术特征相结合,要解决技术问题,要形成技术方案,要在技术上有贡献,才能够满足专利的要求。


(二)图形用户界面的保护问题


第二个问题也是人工智能发展到现在的一个新问题,即图形用户界面的保护问题。计算机和手机,它跟人之间的这种交互方式,从最早需要敲键盘,要把字母输进去才能够告诉计算机命令是什么,让计算机做什么事情,但是这种要求比较高,并且相对来讲用户体验也比较差。随着技术的发展,就产生了图形用户界面的交互方式。


看到这个图形,按它一下,它就产生某个相应的反应,实现某种功能,这种情况下就不用去学各种计算机语言。直接所见即所得,一看就知道这个图形大概是干什么的,可能是看书的,可能看电影的,这就是用户体验特别好的图形用户界面的一种交互方式。那么这种情况下,这种图形用户界面能不能够用专利制度来进行保护?


这也经过了较长的实践的演变,才最终实现了对图形用户界面的保护。有两个方面的突破:

一个是在专利的审查指南中,过去要求外观设计专利要保护的时候,要提交一个完整的视图。那么对于这种图形用户界面来讲,就会要求这个界面一定是在显示器上或者是在手机的屏幕上面显示,在提交所有的视图时,就会把手机和显示器也一起包括进去,这就带来一个问题:如果用的手机的跟专利中的手机形状不一样,就不构成侵权。这个问题后来得到了解决,所提交的专利文件中只需要突出这个图形用户界面,其他的图案只作为参考,可以不用提交。


另外一个在告侵权的时候,能不能够只是拿图形用户界面来去判断对方是不是构成侵权,这就涉及到局部外观设计的问题,这方面在去年才修改生效的专利法中,对于局部外观设计给予了认可。所以这块目前来讲,法律上的保护已经不存在障碍了。


(三)人工智能生成物的专利保护


最后一个问题其实跟版权的问题接近,即人工智能生成的技术方案能不能作为专利的保护客体?


目前在人工智能领域,已经在利用人工智能产生新的技术方案。比如,谷歌已经用人工智能优化芯片的设计;麻省理工用AI技术来筛选新的抗生素。甚至还有一个人工智能领域的DABUS全球专利申请:它完全是一个由人工智能自己设计的技术方案,在全球进行了申请。那么DABUS能不能够获得专利权的保护?


DABUS是一个叫做斯蒂芬泰勒的博士创建的人工智能系统,它根据海量输入的数据,自己研发出了两个产品:一个是方便残障人士的饮料容器,还有一个在紧急情况下的警示灯。那么这个博士为了有意的去试一下各国对于这样一种完全由人工智能作为发明人完成的技术方案,能不能进行专利保护,就申请了一个PCT申请,然后进入各个国家测试,对于这样一个由人工智能完成的技术方案,各个国家能不能够给予专利权保护。


该专利申请在南非已经授权了,但是我们要注意南非并不进行实质性审查,其实只要满足形式上的要求,就可以授权,并不进行实质性的判断。所以南非授权其实不能说明太多的问题,但是接下来大部分的国家都是需要进行实质性审查的。因此到了澳大利亚、欧洲专利局、美国、英国都以发明人应当是自然人为理由,驳回了这个DABUS的专利申请。


所以,在这些已经进行审查的国家,全部都驳回该专利申请。还有一些待审的,像中国在内的国家,现在还没有进入到实审程序,也就是还没有得出审查结论,我们拭目以待。但是大概率来判断,至少在中国,我个人认为一定会因为发明人应当是自然人而被驳回。所以目前来讲,核心的问题就是各国专利法都认为发明人应当是自然人,而不能是人工智能。


在这种情况下,美国的律师总结了三个方面的问题:


1. 专利法中的发明人定义是否包括非自然人?

2.专利申请人需要有发明人的授权,以说明其有正当的理由从发明人处承继专利的申请权。那么,人工智能系统能否“授权”给泰勒博士?或者是否作为职务发明?

3.泰勒博士认为将人工智能机器认定为发明人,有助于人工智能领域的发明创新。这种政策考量是否合理?


专利维权的过程中也会存在很大的问题,我们看到国内所谓涉及到人工智能的专利诉讼第一案,小i机器人诉苹果。该诉讼案可谓一波三折,从2012年6月份就开始起诉苹果侵权,然后苹果请求宣告专利权无效。经过一审二审最后直接打到了最高法院,终于在2020年6月份最高院判这个专利权仍然有效。专利权既然有效,小i机器人继续提起诉讼,要求苹果停止侵权。但是最新的报道就截止到去年9月份,小i机器人继续向上海高院提起行为保全,也就是所谓的临时禁令,但是到目前为止这个案子仍然没有结束,这个案子大概已经打了10年。


其实专利维权,特别是涉及AI程序机案件确实存在很大的困难点,因此有人就此总结了三点:


1.AI程序可能由甲开发,由乙购买并拥有,由丙运营,由丁训练,确定侵权人比较困难;

2.侵权发生地的判定比较复杂;

3.捕捉AI设备侵权证据很困难。


三、AI领域的商业秘密风险防范实践 ///


百度这个案子就是离职员工把商业秘密带走,还成立了一家具有竞争关系的公司,造成了百度的商业秘密受到侵害。百度诉请对方停止侵害,赔偿损失5000万元,最后这个案子以撤诉的方式结案。另外一个是关于大疆的源代码泄露案,大疆的员工把源代码上传到了一个网站,造成了源代码的泄露,并且源代码的泄露造成了安全的漏洞。因为我们知道在网络安全领域,如果源代码泄露的话,黑客很容易找到漏洞去攻击,所以这就造成了100多万的经济损失。最后法院判决该员工侵犯商业秘密罪,判处有期徒刑6个月,并处罚金20万元。


针对两个案子,我们一方面了解到,商业秘密的保护对于一个企业来讲还是非常重要的,特别是对于人工智能领域涉及到源代码的核心商业机密,无论是技术方面,还是商业方面,都有可能会造成对公司的重大损失,所以商业秘密的保护,在人工智能领域有特别重要的价值。那么商业秘密是什么?


其实从概念本身大家也能够体会得到,在商业上能够对权利人带来经济价值,但是它又处于保密的状态。商家秘密包括了技术信息和经营信息,只要满足经济价值、不为公众所知,并且还采取了保密措施这三个要件,就可以构成商业秘密。


其中,所谓商业秘密的价值性是指商业秘密能为权利人带来现实的或潜在的经济价值或竞争优势。但价值性不仅仅体现在能够给权利人带来直接的经济效益,某些消极的信息也同样具有价值性。例如如一些失败的技术方案,也为权利人过度不合理研发减少费用的支出、避免时间的浪费或帮助拓宽科研或经营的思路。这些信息不能在商业领域去使用,不具有实用性,但却能为权利人带来经济价值,赢得竞争优势,在权利人采取保密措施的情形下也可以获得商业秘密保护。


商业秘密很重要的构成要件就是要采取保密措施,如果不采取任何保密措施,当去主张别人侵犯你的商业秘密或者泄露你的商业秘密的时候,可能在司法审判中处于非常大的不利地位。与其他知识产权相比,商业秘密的特点就是不需要国家授权,不像专利需要请专利局来审查,另外它也不受时间和地域的限制,不要求有创新性,就不要求所谓的独创性的这样要求。这些就是商业秘密的一些特点。


商业秘密常见的泄露途径:一是内部在职员工泄露,二是离职员工泄露,第三个是外部合作,在业务合作的过程中造成泄露,比如说双方合作的过程中,可能对方因为跟你有一些密切的合作,能够接触到你的一些商业的信息或者是技术的信息,那么由合作方造成了泄露。


另外就是外部的人员专门来窃密的,这个也可能会造成泄露,一些原料的供应商、生产商、销售商等等,甚至废品的回收者,他们都有可能接触到你的秘密,比如说一些文件没有经过碎纸机,就把它当做垃圾扔掉了,也是有可能造成泄密的,所以常见的商业秘密泄露途径还是很多的。


商业秘密的保护难点

保护商业秘密的难点:


一是告别人侵权,需要承担举证的责任。首先要举证证明符合法定的商业秘密构成要件,比如说刚才介绍的秘密性、价值性和保密性,然后还得证明对方的信息或方案跟你的商业秘密实质上相同,才能够完成所谓的举证责任。


第二个难点需要厘清商业秘密的载体和秘密点。所谓的商业秘密的载体,就是携带或存储商业秘密的工具,例如是纸,还是移动硬盘或光盘,这就是所谓载体。


第三个是所谓商业秘密的秘密点到底是什么,具体内容是什么?如果只是特别笼统的声称只要进入公司,公司的所有东西都是商业秘密,那是不可以的。一定要具体指出来到底哪些构成商业秘密,比如机械加工的工艺参数、食物配方的配料比、客户的名单等等。这些内容只需要告诉那些承担保密责任的人,并且要把秘密点说清楚,所以这是一个难点。


第四个难点就是怎样举证企业采取了相应的保密措施,这点非常重要。因为很多诉讼打不赢的原因就是原告没有办法举证证明采取了相应的保密措施。所谓的保密措施不是简单的在员工劳动合同当中,或者是公司的规章制度当中写明在职期间接触的所有信息都需要保密,或者要求所有员工保护企业的商业秘密,不是这么简单。而是具体采取一些措施,比如对员工进行分级管理,不是所有人都要保密,特定人员才需要明确其保密责任。


例如,那些能够接触到核心方案的技术人员或者核心的管理人员,范围不宜太大。另外,对涉密的保密载体,要采取防范措施,例如锁入保险柜里,或者放入专门的房间。载体上要有保密的标识,让别人一看就知道需要保密,比如在文件上印上保密两个字,然后把它放到保险柜里边,这保险柜还锁上了,并且只有极少数的人有权限打开。


如果是电子信息,则需要设置访问密码或者权限。关于签订保密协议,协议中要明确的告知对方你的秘密点是什么。对涉密的机器、厂房、车间,需要对来访者有一些限制。所有这些都能够证明确实采取了一些保密的措施。


至于怎么证明侵权方的侵权行为,这一点其实也比较难。法院在判断的时候,遵循的原则叫做接触+实质性相似-合法来源。也就是说,如果被告能够证明有合法来源,它就不构成商业秘密侵权。


那么所谓的合法来源有哪些?


(1)自主研发,比如自主发明一种技术方案,虽然跟你的长得很像,但是确实是自主发明的,有相应的证据。另外比如从别人那里通过合法手段买来的或者获得许可的。


(2)权利人自己泄露的,比如参加一个会,把技术方案在会上进行传播,或者做了一个演讲,或者权利人自己在网上发表了,自己泄露了。


(3)反向工程,比如是一个机械装置,被告买了以后回去拆,就能看出来其结构原理,也就是很容易被反向出来,这都算合法获得。或者逆向推理,通过原告最终的产品,能够逆向推导出来是怎么做出来。


因此,只要被告能够证明有合法获取商业秘密的可能性,并且有证据支持,就不构成侵权。如果被告不能够举证证明其合法获得,接下来就需要原告证明被告有接触的可能性,比如说他原来是你的员工,或者是你的合作伙伴。还有证明对方的信息,不管是技术信息也好,还是商业信息也好,它跟你的商业秘密实质相同,只有满足这些条件,才能够判断对方构成了商业秘密的侵权,所以这是它的第四个难点。


那么企业如何做好商业秘密的保护体系呢?我觉得主要是六个方面:


(1)对商业秘密进行定密分级;

(2)要进行泄密的风险评估;

(3)要制定保护策略;

(4)有保密措施,并且要落实;

(5)设置商业秘密的重点区域并进行防护;

(6)危机处理:

一旦发生泄密事件,或者发现有人窃取了秘密信息,就要进行危机处理。比如员工未经过公司的许可把秘密信息放到网上去了,要尽快追查,把所有的信息都要删除掉,这就是所谓危机处理。


上述六个方面就是构建商业秘密的保护体系。正是因为AI技术发展迅猛,导致现有的知识产权制度很难进行充分保护,传统的版权和专利制度很难迎合新技术发展带来的所有挑战,特别是对算法的保护,那么用商业秘密的方式就是一种很好的方法。所以构建商业秘密的保护体系,对于从事人工智能领域的企业来讲,有非常独特的价值。


想了解更多直播回放内容,请点击链接:

人工智能创作的生成物能否通过著作权来保护?为何专利对算法有很大的障碍?万字长文讲述:知识产权问题与风险防范(上)