程序员兼律师Matthew Butterick近日起诉了微软、GitHub、OpenAI,声称GitHub的Copilot违反了开源许可证的条款,还侵犯了广大程序员的合法权利。GitHub Copilot于2022年6月发布,这是一款基于AI的编程辅助工具,使用OpenAI Codex在Visual Studio中生成实时源代码和功能推荐。该工具使用来自公共代码存储库的数十亿行代码进行机器学习训练,可以将自然语言转换成数十种编程语言的代码片段。虽然Copilot可以加快编写代码的过程,并简化软件开发,但它使用公开的开源代码,这让专家们不由得担心它违反了许可归属和限制。开源许可证(比如GPL、Apache和MIT许可证)要求注明作者的姓名和特定的版权。然而,Copilot却在删除这个部分,甚至当代码片段超过150个字符且直接从训练集提取时,并不注明出处。一些程序员甚至称这种做法为开源洗钱,这种做法造成的法律影响在这款AI工具推出后得到了证明。在诉讼中代表Butterick的律师事务所Joseph Saveri声称:“微软似乎无视基础开源许可证的条件及其他法律要求,从别人的工作中获利。”更为糟糕的是,有人声称Copilot错误地泄露了发布在公开代码存储库上的秘密内容,因而包含在训练集中,比如API密钥。除了违反许可证外,Butterick还指控开发功能违反了以下法规或政策:该投诉已提交到美国加州北区地方法院,要求法院批准90亿美元(646.65亿人民币)的法定损害赔偿金。诉状写道:“每当Copilot提供非法输出,它就违反第1202条三次,即分发没有(1)注明出处,(2)版权通知,(3)许可条款的许可材料。”“因此,如果每个用户在使用Copilot的整个过程中(早期用户使用Copilot最多长达15个月之久)只收到一个违反第1202条的输出,那么GitHub和OpenAI就违反了DMCA 360万次。每次违反的最低法定赔偿金为2500美元,换算后相当于90亿美元。”Butterick在10月初的一篇博文中还提到了另一个话题,讨论了Copilot可能给开源社区带来的损害。这名程序员认为,通过向人们提供代码片段,却从不告诉他们是谁创建了他们在使用的代码,促进开源贡献和合作的动机实际上荡然无存。Butterick写道:“微软在搭建一个新的有围墙的花园,它将阻止程序员发现传统的开源社区。”“久而久之,这个做法会使开源社区挨饿。用户的注意力和参与度将被转移,远离开源项目本身——远离他们的源代码库、问题跟踪器、邮件列表以及讨论板。”Butterick担心,如果长此以往,Copilot会导致开源社区走向衰落,训练数据中的代码质量也会随之下降。参考资料:https://www.bleepingcomputer.com/news/security/microsoft-sued-for-open-source-piracy-through-github-copilot/
还没有评论,来说两句吧...