DeepSeek desafia OpenAI com inovação em IA transparente, superando OpenAI em 3 parâmetros

Fonte Cryptopolitan

, a visualização tem um bom desempenho em benchmarks como AIME (American Invitational matic Examination) e MATH, que medem habilidades de resolução de problemas e raciocínio. Como a IA parece hábil em lidar com problemas matic e lógicos complexos, ela pode estar pronta para competir com o ChatGPT da OpenAI e especificamente com o OpenAI o1.

Esta semana, Le Chat da Mistral AI também anunciou atualizações para permitir acesso gratuito a novos recursos. Os lançamentos aparentemente estão criando intensa concorrência no mercado de IA generativa, superando as deficiências um do outro.

DeepSeek pensa em voz alta, ao contrário do ChatGPT

DeepSeek diz que sua IA pode mostrar raciocínio passo a passo em tempo real para tornar seu processo de pensamento mais transparente. Enquanto isso, a empresa de IA também disse que lançará o modelo de código aberto e as ferramentas de desenvolvedor de API nos próximos dias.

De acordo com um gráfico de comparação citado pelo comentarista de IA e tecnologia Andrew Curran, DeepSeek-R1-Lite-Preview alcança a pontuação mais alta em parâmetros como AIME (52,5) e Codeforces (1450), superando concorrentes como OpenAI o1-preview e Claude 3.5 Sonnet.

Também lidera no MATH-500 (91,6), indicando alto desempenho em tarefas avançadas de resolução de problemas. No entanto, fica atrás no GPQA Diamond (58,5) e Zebra Logic (56,6) em comparação com modelos como OpenAI o1-preview (73,3 e 71,4, respectivamente). Os números significam que há espaço para melhorias nos segmentos de conhecimento geral e raciocínio lógico.