As pessoas por trás do ChatGPT levantaram preocupações de que os modelos de IA Deepseek da China, que são significativamente mais baratos que as alternativas ocidentais, podem ter sido desenvolvidas usando dados do OpenAI. Essa suspeita provocou uma reação significativa no setor de tecnologia dos EUA, com o ex-presidente Donald Trump rotulando Deepseek como um "alerta" após uma enorme queda de US $ 600 bilhões no valor de mercado da NVIDIA.
A introdução da Deepseek desencadeou um forte declínio nos estoques de empresas investidas profundamente na tecnologia de IA. A NVIDIA, um participante importante no mercado de GPUs essenciais para a execução de modelos de IA, experimentou uma queda histórica de 16,86% no preço das ações. Outros gigantes da tecnologia, como Microsoft, Meta Plataform, e a empresa controladora do Google, o Alphabet viu, que varia de 2,1%a 4,2%, enquanto a Dell Technologies, fabricante de servidores de IA, caiu 8,7%.
O modelo R1 da Deepseek, construído no Deepseek-V3 de código aberto, afirma exigir menos poder computacional e foi treinado por apenas US $ 6 milhões. Essas reivindicações levaram ao ceticismo sobre os pesados investimentos nos EUA que as empresas de tecnologia estão fazendo na IA, causando desconforto entre os investidores. O aplicativo da Deepseek subiu rapidamente ao topo das paradas de download de aplicativos gratuitos nos EUA em meio a discussões sobre sua eficácia.
A Bloomberg relatou que o OpenAI e a Microsoft estão investigando se o DeepSeek usou a API do OpenAI para incorporar os modelos do OpenAI por conta própria. O Openai reconheceu a Bloomberg que as empresas chinesas e outras pessoas estão tentando destilar dados de liderar os modelos de IA, uma prática que viola os termos de serviço da OpenAI.
A OpenAI enfatizou seus esforços para proteger sua propriedade intelectual e destacou a importância de colaborar com o governo dos EUA para proteger os modelos avançados de IA de serem explorados por concorrentes e adversários. David Sacks, a AI Czar de Trump, disse à Fox News que há evidências significativas sugerindo que a Deepseek usou a destilação para extrair conhecimento dos modelos da OpenAI e previu que liderar as empresas de IA em breve tomariam medidas para evitar tais práticas.
Em meio a esses desenvolvimentos, os críticos apontaram a ironia das acusações do Openai, dada sua própria história de usar conteúdo da Internet protegido por direitos autorais para treinar o ChatGPT. Em janeiro de 2024, o Openai argumentou em uma submissão à Casa dos Lordes do Reino Unido que é "impossível" desenvolver modelos de IA como ChatGPT sem usar materiais protegidos por direitos autorais, pois os direitos autorais cobrem praticamente todas as formas de expressão humana. Eles afirmaram ainda que a limitação de dados de treinamento aos trabalhos de domínio público não atenderia às necessidades dos usuários de hoje.
O uso de materiais protegidos por direitos autorais no treinamento de IA tornou -se uma questão controversa, destacada por ações judiciais como a ação do New York Times contra o Openai e a Microsoft em dezembro de 2023 para o "uso ilegal" de seu conteúdo. A Openai defendeu suas práticas como "uso justo" e descartou o processo como infundado. Da mesma forma, uma ação movida por 17 autores, incluindo George RR Martin, em setembro de 2023, acusou o Openi de "roubo sistemático em escala em massa".
Os precedentes legais, como o Decisão de Direitos Autorais de Direitos Autorais dos EUA de 2018, mantidos pelo juiz distrital Beryl Howell em agosto de 2023, complicaram ainda mais a questão afirmando que a arte gerada pela IA não pode ser protegida por direitos autorais devido à ligação essencial entre a criatividade humana e a proteção de direitos autorais.
A Deepseek é acusada de usar o modelo do OpenAI para treinar seu concorrente usando a destilação. Crédito da imagem: Andrey Rudakov/Bloomberg via Getty Images.