Chatgpt背后的人们提出了担心中国的DeepSeek AI模型(比西方替代方案便宜得多)可能是使用OpenAI的数据开发的。这种怀疑在美国科技界引发了重大反应,前总统唐纳德·特朗普(Donald Trump)将DeepSeek标记为“唤醒电话”,因为Nvidia的市场价值下降了6000亿美元。
DeepSeek的引入引发了深入投资AI技术的公司的股票急剧下降。 NVIDIA是GPU市场中运行AI型号必不可少的主要参与者,其股价下跌了16.86%。 Microsoft,Meta Platforms和Google的母公司Alphabet等其他科技巨头的下降范围从2.1%下降到4.2%,而AI服务器的制造商Dell Technologies下降了8.7%。
DeepSeek的R1型号建立在开源DeepSeek-V3上,声称需要较少的计算能力,据报道仅接受600万美元的培训。这些主张引起了人们对美国科技公司在AI的巨额投资的怀疑,导致投资者不安。在讨论其有效性的讨论中,DeepSeek的应用程序很快升至美国免费应用程序下载图表。
彭博社报道说,Openai和Microsoft正在调查DeepSeek是否使用Openai的API将Openai的模型纳入自己的模型。 Openai向彭博社承认,中国公司和其他公司正试图从带领美国AI模型中提取数据,这种做法违反了Openai的服务条款。
Openai强调了其为保护其知识产权的努力,并强调了与美国政府合作保护高级AI模型的重要性,以免受到竞争对手和对手的利用。特朗普的AI沙皇戴维·萨克斯(David Sacks)告诉福克斯新闻(Fox News),有大量证据表明,DeepSeek使用蒸馏来从Openai的模型中提取知识,并预测,带领美国AI公司很快将采取措施来防止这种做法。
在这些事态发展中,批评家指出了Openai指控的讽刺意味,鉴于其自己使用受版权保护的Internet内容来培训Chatgpt的历史。在2024年1月,Openai在向英国上议院提交的意见书中说,在不使用受版权保护的材料的情况下开发像Chatgpt这样的AI模型是“不可能”的,因为版权几乎涵盖了所有形式的人类表达方式。他们进一步指出,将培训数据限制在公共领域工作将无法满足当今用户的需求。
在人工智能培训中使用受版权保护的材料已成为一个有争议的问题,这是诸如2023年12月《纽约时报》针对OpenAI和Microsoft诉讼的诉讼,以“非法使用”其内容。 Openai将其做法辩护为“合理使用”,并将诉讼视为毫无根据。同样,包括乔治·RR·马丁(George RR Martin)在内的17位作者提起的诉讼在2023年9月指控Openai“大规模的系统盗窃”。
法律先例,例如2023年8月贝丽尔·豪威尔(Beryl Howell)的2018年美国版权局裁决,这进一步使问题复杂化,表明由于人类创造力与版权保护之间的基本联系,无法获得AI生成的艺术。
DeepSeek被指控使用Openai的模型使用蒸馏来训练其竞争对手。图片来源:Andrey Rudakov/Bloomberg通过盖蒂图像。