Muchas personas hablan de inteligencia artficial y de cómo nos cambiará las vidas. Muchas otras personas tienen muchas dudas y expectativas a poder mejorar su uso de estas herramientas.
El Laboratorio de Inteligencia Artificial (LIA) nació para avanzar en la construcción de soluciones sostenidas por el uso y aplicación de Inteligencia Artificial y también, avanzando en la apropiación de prácticas éticas en su desarrollo.
Si quieres saber y entender de qué hablan y qué puede hacer la Inteligencia Artificial por ti, ¡no dejes de tener este Newsletter a la mano que te lo contamos todo!
En esta edición, exploraremos una variedad de temas interesantes impulsados por la innovación en hardware, software y modelos fundacionales, tal como se desprende de las recientes noticias y análisis. Desde la optimización de la inferencia a gran escala hasta la aparición de modelos de lenguaje de próxima generación y la revitalización de los asistentes de voz, el panorama de la IA continúa evolucionando a un ritmo vertiginoso.
Acompáñanos en este recorrido por las novedades más destacadas. |
| |
¡Lo más interesante que verás hoy!
|
| |
Optimizando la Inferencia de IA con Dynamo de Nvidia
Nvidia ha presentado Dynamo, una nueva "operating system" diseñada para optimizar la inferencia de IA a escala. El CEO Jensen Huang la describió como el "sistema operativo de una fábrica de IA" . Dynamo es una suite de inferencia de código abierto que optimiza motores como TensorRT LLM, SGLang y vLLM para ejecutarse de manera rápida y eficiente en grandes cantidades de GPUs .
- Dynamo busca el equilibrio entre rendimiento y throughput, ofreciendo insights sobre el paralelismo óptimo (experto, pipeline o tensor).
- Disgrega prefill y decode en diferentes aceleradores, con un planificador de GPU que asigna recursos según la demanda.
- Incluye enrutamiento de prompts para maximizar los aciertos en la caché de clave-valor (KV), que almacena el estado del modelo.
- Incorpora una librería de comunicación de baja latencia y gestión de memoria para optimizar el uso de HBM, memoria del sistema y almacenamiento en frío.
- Nvidia afirma que Dynamo puede duplicar el rendimiento de inferencia en sistemas Hopper con modelos Llama y ofrecer una ventaja de hasta 30 veces en sistemas Blackwell NVL72 con DeepSeek-R1.
- Aunque optimizado para Nvidia, se integra con librerías populares como vLLM, PyTorch y SGLang, funcionando en GPUs Nvidia desde Ampere.
|
| |
La Próxima Generación de Modelos de Lenguaje: GPT-4.5, Claude 3.7 Sonnet y Mercury Coder
El desarrollo de modelos de lenguaje continúa avanzando con nuevos lanzamientos y enfoques.
- OpenAI ha lanzado GPT-4.5 como una "research preview", un modelo grande entrenado con gran cantidad de computación . Aunque no está afinado para el razonamiento en cadena de pensamiento, podría ser la base de futuros modelos de razonamiento. GPT-4.5 muestra mejoras en conocimiento general, adherencia a prompts, creatividad e inteligencia emocional, y reduce la alucinación.
- Anthropic presentó Claude 3.7 Sonnet, con un enfoque de razonamiento híbrido que permite a los usuarios controlar la cantidad de "pensamiento" del modelo. Entrenado para codificación y desarrollo web frontend, ofrece un modo de "pensamiento extendido" con un presupuesto de tokens asignado para mejorar los resultados y muestra los tokens de razonamiento. También introdujeron Claude Code, una herramienta de línea de comandos para codificación asistida por IA.
- Inception Labs presentó Mercury Coder, un modelo de difusión para generar código en versiones pequeña y mini. A diferencia de los modelos autorregresivos, refina todos los tokens a la vez, ofreciendo mayor velocidad en la generación de tokens por segundo en GPUs Nvidia H100 en comparación con otros modelos de codificación pequeños.
|
| |
Alexa+ de Amazon: Un Asistente de Voz de Próxima Generación Impulsado por IA Generativa
Amazon ha anunciado Alexa+, una actualización importante de su asistente de voz Alexa, diseñado para actuar como un agente autónomo para compras, reservas y reproducción de multimedia.
- Alexa+ utiliza IA generativa, incluyendo modelos como Anthropic Claude y Amazon Nova, con un sistema de enrutamiento para seleccionar el mejor modelo para cada solicitud.
- Entrenado para comprender lenguaje coloquial, Alexa+ puede interactuar con proveedores en línea, gestionar dispositivos de hogar inteligente y realizar diversas tareas.
- Reconoce usuarios individuales, recuerda información personalizada y puede actuar proactivamente.
- Esta actualización busca revitalizar Alexa aprovechando los avances en modelos de lenguaje grandes y tecnología agentic.
Desafíos Persistentes: La Detección de Actividad de Voz (VAD)
A pesar de los avances, la detección de actividad de voz (VAD) en entornos ruidosos sigue siendo un desafío técnico. Los sistemas actuales tienen dificultades para distinguir la voz del usuario del ruido de fondo.
Kyutai Labs presentó Moshi, un modelo que innova al habilitar flujos de audio bidireccionales persistentes, eliminando la necesidad de un VAD explícito. En lugar de modelar la toma de turnos, Moshi escucha continuamente y decide cuándo hablar. La arquitectura de los modelos de voz continúa evolucionando. |
| |
El Impacto del Código Abierto: Meta y su Modelo Llama
Meta destacó en SXSW cómo la inteligencia artificial de código abierto, incluyendo modelos como Llama, está democratizando el acceso a la IA y fomentando la innovación. Meta enfatiza la importancia de que todos se beneficien de las oportunidades económicas de la IA.
- Empresas y desarrolladores están utilizando Llama para impulsar la innovación en diversos campos, como la búsqueda de empleo (WriteSea), agentes legales y de cumplimiento (Authorship), detección médica (Zauron Labs) y automatización de procesos en salud (Cofactor).
- Meta está explorando la personalización en la IA a través de iniciativas como AI Studio, permitiendo a los usuarios crear sus propias IA personalizadas.
- La compañía cree que la personalización mejora la utilidad y el compromiso con la tecnología.
|
| |
En este boletín te presentamos avances que reflejan la continua y dinámica evolución del campo de la inteligencia artificial.
Desde la optimización de la infraestructura de inferencia con Dynamo hasta la aparición de modelos de lenguaje más potentes y especializados como GPT-4.5, Claude 3.7 Sonnet y Mercury Coder, y la ambiciosa renovación de asistentes de voz como Alexa+, la innovación se manifiesta en múltiples frentes.
El compromiso con el código abierto, liderado por iniciativas como Llama de Meta, sigue democratizando el acceso a la IA y fomentando una amplia gama de aplicaciones creativas y prácticas.
Si bien persisten desafíos técnicos, como la mejora de la detección de voz en entornos ruidosos , la investigación y el desarrollo constante prometen un futuro aún más transformador para la inteligencia artificial.
Estaremos atentos a los próximos avances en este emocionante campo. |
| |
Hasta aquí nuestro Newsletter de hoy.
Mantente informado y sé parte de la conversación sobre el futuro de la IA. No dejes de contactarnos y seguirnos en nuestras redes sociales:
X y Linkedin |
| |
|