¿Razonar o no razonar? ¿Gastar más o gastar menos? ¿Sirve o no sirve? Creo que como la mayoría de ustedes soy de los que busca siempre más rendimiento por menos valor y de eso se trata el tema de hoy y viene de la mano de Google.
Salieron a la luz los modelos Gemini 2.0 con Pro Experimental (su mejor modelo) y los modelos Flash que son bastante buenos, muy rápidos y lo más importante: súper baratos.
En el gráfico de abajo se ve que mientras más alto “mejor” el resultado y mientras más a la izquierda más barato, teniendo en cuenta los resultados globales del LMArena.
Y acá volvemos a la lógica de otros mails: ¿Para qué sirven nuevos modelos más baratos? Sencillo: hoy con un poco de conocimiento de código, con acceso a las herramientas básicas y algunos dólares podemos crear soluciones específicas para nuestros problemas.
Podemos tener, por ejemplo, un bot que lea todo nuestro sitio con este modelo Flash y clasifique cada entrada en tema principal y secundarios, que esté conectado a Google Trends y sepa tendencias en tiempo real, nos sugiera contenido y según la inferencia de un razonador como R1 estime los mejores enlaces para nuestras notas. Y es solo una idea básica. Supongamos que gastemos 15 o 20 millones de tokens en el primer paso, pero cada uso posterior va a estar por debajo del centavo de dólar de costo.

Además este tipo de modelo nos obliga a pensar: ¿Es necesario una api de una AI avanzada o de razonamiento, o puedo usar una versión Lite o mini?
En fin, para volver el modelo de Google es multimodal por lo que también da rienda suelta a aplicaciones que acepten audio, imágenes y video.

Relámpagos
- OpenAI trabaja su diseño de chips, optimizado para su flujo de trabajo. No es raro que OpenAI quiera no depender tanto de Nvidia. No es secreto, además, que OpenAI presentó una marca registrada para hardware, así que no va a tardar en aparecer en breve algún reloj o similar con IA.
- Hablando de Nvidia, se conocieron imágenes de su entrenamiento de “robots atletas” que replican movimientos de festejos a partir de simulaciones.

- Adobe sumó a Acrobat un asistente de IA para leer contratos, remarcar fechas claves, simplificará conceptos y comparará con otras versiones del documento para avisarte si algo cambió.
- La herramienta de video Luma AI lanzó una herramienta para mejorar la calidad de videos y llevarlos a 4K.
- Alibaba presenta seis nuevos modelos de inteligencia artificial DeepSeek a precios competitivos y desmiente rumores de inversión.
- Investigadores de Microsoft revelan que la dependencia excesiva de la IA generativa puede debilitar las habilidades de pensamiento crítico entre los trabajadores del conocimiento.
- Elon Musk y un grupo de inversores realizaron una oferta no solicitada de 97,4 mil millones de dólares para adquirir el control de la división sin fines de lucro de OpenAI. Le dijeron que no.
- La IA fue protagonista de ese deporte extraño que juegan los estadounidenses y que tiene su momento cúlmine en la serie mundial, aunque juegan ellos solos. Acá están los anuncios de OpenAI, Google (que tiene un error sobre un dato), Meta (que usó estrellas de cine y humor), Salesforce (también con estrellas de cine) y GoDaddy.
- Los de Tik Tok (ByteDance) y la Universidad de Hong Kong acaban de presentar Goku y Goku+, una familia de modelos de IA que unen la generación de imágenes y videos, mostrando un rendimiento superior en múltiples puntos de referencia visuales y permitiendo contenido comercial hiperrealista para publicidad y marketing.
- La Cumbre de Acción sobre IA en París concluyó y aumentan las tensiones globales ya que Estados Unidos y el Reino Unido se negaron a firmar una declaración multinacional y los líderes europeos anunciaron ambiciosos planes de inversión para competir con el dominio estadounidense. Lo que sí, la UE asegura invertirá 200.000 millones en una IA libre.
- Perplexity lanzó una nueva versión de su modelo de inteligencia artificial interno Sonar, construido sobre Llama 3.3 70B y que ofrece respuestas a 1200 tokens por segundo al mismo tiempo que iguala o supera a los mejores modelos en precisión a una fracción del precio. Más a favor de lo que hablamos al principio.

- YouTube anunció importantes actualizaciones de inteligencia artificial en toda la plataforma, incluido doblaje automático, herramientas ampliadas para creadores y una nueva tecnología de detección de edad.
- Alphabet, OpenAI, Roblox y Discord lanzaron ROOST, una iniciativa de 27 millones de dólares para desarrollar herramientas de inteligencia artificial gratuitas y de código abierto para combatir la explotación infantil en línea y promover la seguridad digital.
Qué estoy usando
En esta sección de cierre te cuento qué herramientas estoy usando en este momento porque, desde mi visión y uso, me da los mejores resultados (por respuesta o por costos).
Es algo súper íntimo y pueden no estar de acuerdo, pero creo que es una manera interesante de no solo decir “existe esto” si no “yo lo uso así” (o no).
Texto: 4o (ya casi nada), o1 y alguna cosita de o3 (plan plus), Redacta.Pro (de pago). Para aplicaciones 4o-mini.
Video: Por ahora nada.
Audio: Elevenlabs (Free) y Adobe Audition (Pago).
Imágenes: Dall-E 3 (Pago) y Adobe Photoshop (Pago), BlinkShot (gratis, pero limitada) e ImagenFX (con VPN de EEUU)
Programación: o3 mini (plan plus)
Buscador: Google y GPT Search (de pago).
Música: Suno.
Miscelánea: Endless.