DeepSeek desafía a OpenAI con un avance transparente en IA, superando a OpenAI en 3 parámetros

Fuente Cryptopolitan

, la vista previa funciona bien en puntos de referencia como AIME (American Invitational Mathe matic s Examination) y MATH, que miden las habilidades de razonamiento y resolución de problemas. Como la IA parece hábil para manejar problemas matic y lógicos complejos, podría estar lista para competir con ChatGPT de OpenAI y específicamente con OpenAI o1.

Esta semana, Le Chat de Mistral AI también anunció actualizaciones para permitir el acceso gratuito a nuevas funciones. Los lanzamientos aparentemente están creando una intensa competencia en el mercado de la IA generativa, superando las deficiencias del otro.

DeepSeek piensa en voz alta a diferencia de ChatGPT

DeepSeek dice que su IA puede mostrar razonamiento paso a paso en tiempo real para hacer su proceso de pensamiento más transparente. Mientras tanto, la compañía de inteligencia artificial también ha dicho que lanzarán el modelo de código abierto y las herramientas de desarrollo de API en los próximos días.

Según un cuadro comparativo citado por el comentarista de tecnología e inteligencia artificial Andrew Curran, DeepSeek-R1-Lite-Preview logra la puntuación más alta en parámetros como AIME (52,5) y Codeforces (1450), superando a competidores como OpenAI o1-preview y Claude 3.5 Sonnet.

También lidera en MATH-500 (91,6), lo que indica un alto rendimiento en tareas avanzadas de resolución de problemas. Sin embargo, está por detrás en GPQA Diamond (58,5) y Zebra Logic (56,6) en comparación con modelos como OpenAI o1-preview (73,3 y 71,4, respectivamente). Las cifras indican que hay margen de mejora en los segmentos de conocimiento general y razonamiento lógico.