Inteligencia Artificial

¿Pueden aprender las empresas tecnológicas a amar los modelos de IA más económicos?

Redaccion NEO·9/6/2026

El auge de la IA se ha construido sobre una suposición básica: los modelos más grandes son más poderosos, y los modelos más poderosos ganan. Ahora, la industria está a punto de descubrir qué sucede si esa suposición comienza a fallar.

Los costos crecientes ya han presionado a los usuarios a reconsiderar los modelos más pequeños y económicos. Esta compra de modelos consciente del costo es nueva y no está claro cómo afectará a la industria, pero el impacto probablemente será significativo.

Una predicción, expuesta de la mejor manera por el cofundador de Coinbase Brian Armstrong, es que resultará en que la gran mayoría de las tareas se trasladen a modelos más baratos.

"[L]a demanda de inteligencia es casi infinita, pero el 80% de las cargas de trabajo se ejecutarán en modelos 99% más baratos dentro de 12-18 meses", escribió Armstrong en X. "El 20% de las cargas de trabajo seguirá ejecutándose en modelos de última generación donde maximizar el coeficiente intelectual es importante".

Es difícil exagerar qué cambio tan significativo sería para la industria de la IA si la predicción de Armstrong se cumple.

Hasta ahora, la mayoría de las empresas de IA han competido en calidad, lo que ha significado optar por defecto por el modelo más avanzado disponible. Si esos mismos trabajos pueden ser manejados por modelos más baratos sin afectar la calidad, significaría un cambio masivo en la economía de la IA. Y críticamente, gran parte de los ahorros provendrían de los bolsillos de los grandes laboratorios, infligiendo un golpe financiero a OpenAI y Anthropic justo cuando se dirigen hacia sus salidas a bolsa.

Es un cambio potencialmente sísmico en la industria, que descansa en una pregunta básica: ¿Están listas las empresas para cambiar a modelos más pequeños?

Las pruebas iniciales sugieren que, cuando el sistema está bien organizado, los modelos más baratos podrían funcionar sin ningún sacrificio en calidad. En una prueba reciente de la herramienta de IA legal Harvey, la empresa logró reducir los costos de inferencia 3 veces sin reducir la calidad. La prueba, realizada en asociación con la plataforma de inferencia Fireworks AI, combinó Claude Opus y GLM 5.1 de Fireworks, y pasó a Opus para las tareas más intensivas. El resultado fue una carga significativamente menor en términos de tiempo de servidor y costo general.

"La calidad es lo primero, y en el sector legal siempre lo será", dijo a TechCrunch Gabe Pereyra, cofundador de Harvey, refiriéndose a los servicios legales de IA que proporciona su startup. "Sin embargo, la definición de calidad está evolucionando de simplemente usar el modelo más poderoso para todo, a usar el mejor modelo que obtenga la respuesta correcta de la manera más eficiente".

Esta tendencia a menudo se enmarca en términos de laboratorios principales versus modelos chinos o de peso abierto, pero eso pierde el punto más grande. La verdadera división no es entre modelos propietarios y abiertos; es entre modelos grandes y pequeños. Puedes ahorrar dinero cambiando de GPT-5.5 a DeepSeek V4 Flash, pero cambiar a GPT-5.4-mini funciona igual de bien.

Hay una guerra de precios activa entre la inferencia interna de los grandes laboratorios y los modelos de peso abierto servidos independientemente. Para la pregunta más grande de pequeño versus grande, realmente no importa qué tipo de modelo pequeño gane.

Todo esto podría parecer obvio — obviamente no deberías usar más poder de cómputo

Sigue leyendo

Oye Siri, esto es lo que realmente quiero de la IA

Inteligencia Artificial

¿Pueden aprender las empresas tecnológicas a amar los modelos de IA más económicos?

Sigue leyendo

Oye Siri, esto es lo que realmente quiero de la IA

Los vehículos eléctricos de GM pronto serán compatibles con más tipos de cargadores públicos

GM busca nuevas químicas de baterías para crecer en centros de datos con IA y almacenamiento de energía