A empresa de inteligência artificial Openai tomou a iniciativa de lutar contra o modelo Deepseek R1, anunciando o lançamento de seu O3-mini. A empresa se moveu rapidamente na sexta -feira, na tentativa de responder diretamente ao modelo de IA da startup chinês que tem a conversa do mercado.
O modelo Deepseek R1 foi aclamado como um modelo de IA de próximo nível, com relatórios alegando que o modelo produz respostas fantásticas, imitando o processo de pensamento humano. O modelo também reduz o uso da memória e é mais econômico do que outros concorrentes no mercado. Além de seu desempenho incrível, a criação do modelo custou US $ 6 milhões, em comparação com o ChatGPT-4 do OpenAI, que custa quase US $ 100 milhões.
Com o modelo recente de Deepseek sendo aclamado como o mais econômico do mercado, ele pode ter atingido um acorde, pressionando o Openai para agir. De acordo com sua postagem no blog, a empresa mencionou que o modelo O3-mini é o "mais econômico" em sua série de raciocínio. "Estamos lançando o Openai O3-mini, o modelo mais novo e econômico de nossa série de raciocínio, disponível no ChatGPT e na API hoje", dizia post do blog
Em sua declaração, a empresa também provocou algumas das capacidades do novo modelo, observando que avança o que os modelos menores podem alcançar. "Visualizado em dezembro de 2024, esse modelo poderoso e rápido avança os limites do que os pequenos modelos podem alcançar (...), mantendo o baixo custo e a latência reduzida do OpenAi O1-mini", acrescentou o OpenAI.
De acordo com sua declaração, a de inteligência artificial permitirá que os usuários enj os recursos de raciocínio dos modelos gratuitamente pela primeira vez, enquanto permitem que os usuários pagos enj três vezes o limite diário de mensagens, empurrando -o de 50 para 150. A empresa está abrindo isso para aumentar o uso da nova linha de modelos de raciocínio. O novo modelo, que vem em versões baixas, médias e altas, fornecerá aos usuários melhores respostas para obter mais inferência.
A família de modelos de IA "O" da empresa se concentra principalmente nas tarefas de raciocínio. Isso significa que eles são menos criativos em comparação com os modelos da família GPT, mas têm uma cadeia de raciocínio de pensamento incluído em seus modelos. Isso permite que eles resolvam problemas complexos, criem melhores códigos de estrutura etractraseiros em análise errada. Embora o novo modelo seja pior que o O1-mini em conhecimento geral e a cadeia multilíngue de pensamento, ele tem um desempenho melhor na codificação, na factualidade e em todos os outros benchmarks.
O avanço alcançado pela DeepSeek com seu modelo de IA, que proporcionou melhores resultados do que o modelo de IA da OpenAI, causou um pouco de alvoroço na indústria de tecnologia dos Estados Unidos. Além do burburinho, o avanço também acabou com cerca de US $ 1 trilhão do mercado de tecnologia dos EUA, com a Nvidia perdendo US $ 600 bilhões em valor de mercado. O desenvolvimento também questionou a demanda por seus caros chips de IA no futuro.
A lacuna de eficiência está proveniente da nova abordagem que a Deeepseek adotou em sua arquitetura modelo. Enquanto empresas artificiais nos EUA estavam tentando aumentar o poder de computação de seus modelos, a Deepseek conseguiu otimizar como os modelos processam as informações, levando a mais eficiência. A pressão foi aumentada quando a empresa de tecnologia chinesa Alibaba lançou seu QWEN2.5 Max.
Enquanto isso, o O3-mini estará olhando para aumentar a lacuna, com o modelo executando 24% mais rápido que o modelo anterior. Ele também corresponde a alguns modelos mais antigos e bate em outros em benchmarks -chave. Embora seu preço seja bastante competitivo, é maior que o do R1 de Deepseek. O O3-mini custa US $ 0,55 por milhão de tokens de entrada e tokens de produção de US $ 4,40 por milhão, enquanto o Deepseek custa US $ 0,14 e US $ 2,19 para os mesmos volumes.
Academia Cryptopolitan: como escrever um currículo Web3 que lança entrevistas - folha de dicas grátis