DeepSeek: el modelo que quiere cambiar las reglas de la IA

DeepSeek es una startup china que ha presentado unos modelos capaces de competir e incluso superar, según sus pruebas, a gigantes como GPT-5 o Gemini-3 Pro. Y lo más sorprendente: son gratuitos y de código abierto.

La inteligencia artificial avanza a una velocidad difícil de seguir, pero cada cierto tiempo surge un proyecto que realmente marca un antes y un después. 

Un salto inesperado en el mundo de la IA

DeepSeek acaba de lanzar DeepSeek-V3.2 y DeepSeek-V3.2-Speciale, dos modelos que combinan razonamiento complejo con la capacidad de utilizar herramientas de forma autónoma. Esto significa que pueden pensar, planificar y ejecutar acciones dentro de un mismo flujo de trabajo, algo que hasta ahora solo se veía de forma limitada en otros sistemas.

Según la empresa, DeepSeek-V3.2 iguala el rendimiento de GPT-5 en pruebas avanzadas de razonamiento, mientras que la versión Speciale alcanza el nivel de Gemini-3 Pro. No se trata solo de números: Speciale ha conseguido medallas de oro en olimpiadas internacionales de matemáticas e informática, una demostración clara de su potencia.

¿Qué hace diferente a DeepSeek?

Razonamiento integrado en el uso de herramientas

Una de las mayores innovaciones es que puede seguir razonando mientras utiliza herramientas externas, como buscadores web, calculadoras o editores de código. Incluso puede hacerlo en dos modos:

  • Razonamiento visible, donde el usuario puede ver el proceso.
  • Sin razonamiento visible, para respuestas directas y rápidas.

Además, la cadena de pensamiento se mantiene activa entre llamadas a herramientas, lo que da lugar a interacciones más naturales y coherentes.

Una arquitectura más eficiente

Esta startup ha desarrollado una tecnología llamada DeepSeek Sparse Attention (DSA). Esta permite manejar contextos muy largos de hasta 128.000 tokens con un coste computacional mucho menor.

Aunque el modelo cuenta con más de 671.000 millones de parámetros, solo activa 37.000 millones por token. Esto reduce el coste de funcionamiento a la mitad, lo que permite que modelos tan grandes sean más fáciles y baratos de usar.

Entrenamiento intensivo y orientado a agentes

La startup ha invertido una parte importante de su cómputo en entrenamiento por refuerzo, creando más de 1.800 entornos sintéticos y 85.000 tareas pensadas para que el modelo aprenda a actuar como un agente autónomo. De ahí su habilidad para resolver problemas complejos de manera estructurada.

Disponibilidad y transparencia

La startup china ha optado por un camino poco habitual: publicar los pesos completos de los modelos y un informe técnico detallado del entrenamiento. Esta apuesta por la transparencia contrasta con el secretismo de grandes tecnológicas estadounidenses, incluso en proyectos considerados de “código abierto”.

  • DeepSeek-V3.2 está disponible en aplicación, web y API.
  • DeepSeek-V3.2-Speciale, por ahora, solo a través de API.

Con este movimiento, la compañía quiere demostrar que el código abierto puede competir con los modelos propietarios más avanzados, y hacerlo reduciendo costes.

¿Supone un desafío para GPT-5 y Gemini-3?

DeepSeek dice que sí, aunque la realidad es un poco más compleja. Las pruebas públicas no siempre muestran cómo rinde un modelo en situaciones reales, y todavía falta ver cómo funcionará el razonamiento combinado con herramientas en casos más difíciles.

Aun así, el avance es claro: si la startup sigue por este camino, podría cambiar la competencia mundial en inteligencia artificial.

Conclusión

DeepSeek no es solo otro modelo más: es un ejemplo de cómo la innovación abierta y el enfoque en la eficiencia pueden sacudir una industria dominada por unos pocos. Su razonamiento avanzado, su uso autónomo de herramientas y su accesibilidad gratuita lo convierten en un actor a seguir muy de cerca.

Estamos ante un momento clave para la IA, y DeepSeek ha llegado para poner el listón más alto.

En Innova Digital Export queremos ser tu socio estratégico. Desde Inteligencia Artificial hasta exportación digital, estamos aquí para impulsar tu éxito. ¿Hablamos?

Resumen de privacidad

Esta web utiliza cookies para que podamos ofrecerte la mejor experiencia de usuario posible. La información de las cookies se almacena en tu navegador y realiza funciones tales como reconocerte cuando vuelves a nuestra web o ayudar a nuestro equipo a comprender qué secciones de la web encuentras más interesantes y útiles.

Cookies estrictamente necesarias

Las cookies estrictamente necesarias tiene que activarse siempre para que podamos guardar tus preferencias de ajustes de cookies.

Si desactivas esta cookie no podremos guardar tus preferencias. Esto significa que cada vez que visites esta web tendrás que activar o desactivar las cookies de nuevo.

Cookies de terceros

Esta web utiliza Google Analytics para recopilar información anónima tal como el número de visitantes del sitio, o las páginas más populares.

Dejar esta cookie activa nos permite mejorar nuestra web.