NEO
Tendencias
·Cannes Lions 2026 abre convocatoria a shortlists·IA generativa supera 40% de adopcion en agencias MX·Inversion publicitaria digital crece 18% en Q1 2026·Effie Mexico anuncia nuevas categorias para edicion 2026·WPP reporta resultados en Latam·Meta lanza nuevas APIs para retail media·Cannes Lions 2026 abre convocatoria a shortlists·IA generativa supera 40% de adopcion en agencias MX·Inversion publicitaria digital crece 18% en Q1 2026·Effie Mexico anuncia nuevas categorias para edicion 2026·WPP reporta resultados en Latam·Meta lanza nuevas APIs para retail media
Inteligencia Artificial

¿Pueden las empresas tecnológicas aprender a amar los modelos de IA más baratos?

Redaccion NEO·10/6/2026
Compartir:LinkedInXWhatsAppFacebook
¿Pueden las empresas tecnológicas aprender a amar los modelos de IA más baratos?

El boom de la IA se ha construido sobre una suposición básica: los modelos más grandes son más poderosos, y los modelos más poderosos ganan. Ahora, la industria está a punto de aprender qué sucede si esa suposición comienza a romperse.

Los costos cada vez más altos ya han presionado a los usuarios para que le den una segunda mirada a los modelos más pequeños y más baratos. Esta búsqueda consciente del costo es nueva y no está claro cómo afectará la industria, pero el impacto probablemente será significativo.

Una predicción, presentada de la mejor manera por el cofundador de Coinbase, Brian Armstrong, es que resultará en que la gran mayoría de las tareas se cambien a modelos más baratos.

"[L]a demanda de inteligencia es casi infinita, pero el 80% de las cargas de trabajo se ejecutarán en modelos 99% más baratos en 12-18 meses", escribió Armstrong en X. "El 20% de las cargas de trabajo aún se ejecutarán en modelos de última generación donde maximizar el CI es importante".

Es difícil exagerar qué cambio tan significativo sería para la industria de la IA si la predicción de Armstrong se hace realidad.

Hasta ahora, la mayoría de las empresas de IA han competido por calidad, lo que ha significado optar por defecto por el modelo más avanzado disponible. Si los mismos trabajos pueden manejarse con modelos más baratos sin afectar la calidad, significaría un cambio masivo en la economía de la IA. Y de manera crítica, la mayoría de los ahorros vendrían de los bolsillos de los grandes laboratorios, asestando un golpe financiero a OpenAI y Anthropic justo cuando se dirigen hacia sus OPIs.

Es un cambio potencialmente sísmico en la industria, que descansa en una pregunta básica: ¿Están las empresas listas para cambiar a modelos más pequeños?

Las pruebas iniciales sugieren que, cuando el sistema está organizado correctamente, los modelos más baratos podrían sustituir sin ningún sacrificio en la calidad. En una prueba reciente de la herramienta de IA legal Harvey, la empresa pudo reducir los costos de inferencia 3 veces sin reducir la calidad. La prueba, realizada en asociación con la plataforma de inferencia Fireworks AI, combinó Claude Opus y GLM 5.1 de Fireworks, y cambió a Opus para las tareas más intensivas. El resultado fue una carga significativamente menor en términos de tiempo de servidor y costo general.

"La calidad es lo primero, y en derecho siempre lo será", le dijo a TechCrunch Gabe Pereyra, cofundador de Harvey, refiriéndose a los servicios legales de IA que proporciona su startup. "Sin embargo, la definición de calidad está evolucionando de simplemente usar el modelo más poderoso para todo, a usar el mejor modelo que obtenga la respuesta correcta de manera más eficiente".

Esta tendencia a menudo se enmarca en términos de grandes laboratorios versus modelos chinos u open-weight, pero eso pierde el punto más importante. La división real no está entre modelos propietarios y abiertos; está entre modelos grandes y pequeños. Puedes ahorrar dinero cambiando de GPT-5.5 a V4 Flash de DeepSeek, pero cambiar a GPT-5.4-mini funciona igual de bien.

Hay una guerra de precios activa entre la inferencia interna de los grandes laboratorios y los modelos open-weight servidos independientemente. Para la pregunta más importante de pequeño versus grande, realmente no importa qué tipo de modelo pequeño prevalezca.

Todo esto podría parecer obvio: por supuesto no deberías usar más poder de cómputo

Sigue leyendo