庭审进行到此处,双方打的还是明牌,一切不出意料,有些各说各理的意思。
直到请上各自的专家辅助人,对两份结果相悖的司法鉴定意见进行质证,才算进入最不可控的部分。这个环节采取交叉询问的方式,先由本方律师提问,专家回答,再由对方律师提问,专家回答,是国内偏法官纠问式的模式下很少能见到的直接交锋。
先上来的是全源公司聘请的专家刘教授,人工智能方面的著名研究员。
郭律师提问,请刘教授介绍 ai 文生图和文生视频的技术原理。
刘教授不过四十出头,一看就知道是经常做讲座的,学识与台风巨佳,从词向量到扩散模型,再到图像去噪,仅用两页 ppt 就把这个问题解释得清清楚楚。
刘教授最后总结:“其实现在大部分人之所以反对 ai,就是因为没能理解这背后的技术原理,反对的理由通常也是站不住脚的,类似于不允许修铁路因为对人体有辐射。一旦理解了,就会知道 ai 绘画既不是尸体融合也不是强行拼接,人工智能的意思,是它把数据库真的学会了,它生成的结果确实是一种全新的创造。”
最后还不忘上一把价值,说:“社会学上有一个概念叫做反公共地悲剧,tragedy of the antions,指一些人对某些资源具有排他性的所有权,并利用这个权利对资源的使用者进行数量抽成,这种现象会导致资源的使用不足和社会整体利益的损失。我认为这个概念同样适用于本案,对于人工智能这种正在改变整个人类社会格局的新技术,所有国家都在大力促进其发展,都想要跑到前面去。中国要在这个领域获得领先地位,更不应该设置法律障碍,人为地在所有人工智能公司的头顶悬上一把达摩克利斯之剑。”
这番发言总算打破沉闷,旁听席起了少许反应,显然有不少人深以为然。
郭律师也就此打住,对法官说:“我方没有其他问题了。”
轮到言谨提问。
她不急着开口,先向法官申请使用法庭前方两侧的大幅显示屏,在那上面做了展示,而后才道:“我们现在看到的,是由不同公司开发的几款文生图和文生视频的应用软件。请问刘教授,从您的专业角度出发来做判断,它们之间是否存在技术上的不同和生成结果水平的不同?”
答案显而易见,但刘教授还是稍作停顿,看向被告席位,才说:“是的。”
言谨又问:“那我是否可以得出一个结论,并不是只要声称自己是人工智能,就都能达到同样的创造水平?”
刘教授重复刚才的操作,说:“是的。”
言谨提出下一个问题:“那请问刘教授,这种差异是怎么产生的呢?”
刘教授笑,说:“这就是个复杂的问题了,每家公司采用的模型不同,进行预训练的数据集也不同。”
言谨客气致谢,再次提问:“那么是否存在一种可能,有些 ai 绘图工具并未能达到您所说的‘把数据库真的学会了,生成的结果确实是一种全新创造’的程度呢?”
刘教授滞了滞,答:“这个要具体情况具体分析……”
言谨并未打算纠缠,但郭家阳那边已出声打断,对法官说:“原告律师的提问存在引导专家的倾向,请求法庭准许我方辅助人不回答这个问题。”
法官支持了他的意见,看向言谨,提醒她注意提问的方式。
言谨致歉,她其实可以换一种方式重新提问,却出乎对方意料地说:“原告没有其他问题了,申请请上我方的专家辅助人。”
法官点头准许,刘教授顺利完成任务,退出法庭,换了原告方聘请的林博士坐到中间的辅助人席位上。
林博士不过三十几岁,自我介绍身份以及资历,是个数据法领域的学者,正在做人工智能监管方面的理论研究。
双方专家辅助人的名单也是庭前就提交了的,同样都是明牌。言谨可以猜到郭律师和孙力行看到名单时的反应。他们或许会觉得她蠢,因为美国那个同类案件之所以首战失利,除去两位艺术家没做版权登记,还有一个原因就是原告方没能把为什么认为 ai 绘图工具侵权的逻辑解释清楚。而言谨似乎也在犯同样的错误,居然请了一个法学学者来做 ai 案件的专家辅助人,等于白白浪费掉了唯一的外援机会。
这一次,由言谨先提问,她再次开口,仍旧是方才那个问题:“请问林博士,ai 绘图工具生成的内容是否存在复制拼接数据集作品的可能?”
这是早就预演过的流程,林博士要求使用大屏幕,在上面展示材料,同时简述其中的内容:“我这里有一篇马里兰大学和纽约大学联合研究团队的论文,题目叫《扩散艺术还是数字伪造?》arxiv/pdf/221203860pdf,研究了扩散模型当中的过度拟合和数据复制现象。结论指出,一款当下著名的 ai 绘图工具生成的内容与数据集作品的相似度超过 50的可能性达到了 188。也就是说,每一百幅 ai 生成的图片当中,就有将近两幅存在一半以上的复制的现象。而且,训练数据集的大小在很大程度上影响着这个复制率,在使用具体艺术家姓名或者“某某某风格”作为提示词的情况下,这种复制拼接尤其明显,甚至可能达到赝品的程度。”