Descifrando los Sonidos del Océano: Google y la Comunicación Delfín:
Google está utilizando su experiencia en modelos lingüísticos avanzados (LLMs), como Gemini, para una tarea muy singular: la traducción de delfines. La compañía ha desarrollado DolphinGemma, un modelo lingüístico especializado diseñado para analizar los patrones de comunicación de los delfines. Este modelo procesa los clics, silbidos y ráfagas de pulsos que forman las vocalizaciones de los delfines.
Este proyecto es una colaboración entre Google, investigadores del Instituto de Tecnología de Georgia (Georgia Tech) y el Wild Dolphin Project (WDP), que lleva a cabo investigaciones de campo sobre los delfines moteados del Atlántico. DolphinGemma funciona como un modelo de audio-in, audio-out que procesa secuencias de sonidos de delfines para identificar patrones y estructuras, de manera similar a cómo los modelos lingüísticos para la comunicación humana predicen las palabras siguientes en las oraciones.
El modelo utiliza el tokenizador SoundStream de Google para representar eficientemente los sonidos de los delfines. Este modelo de 400 millones de parámetros se ejecuta directamente en teléfonos inteligentes Pixel, que los investigadores del WDP utilizan en su trabajo de campo. Además, el WDP ha desarrollado, en colaboración con Georgia Tech, el sistema Cetacean Hearing Augmentation Telemetry (CHAT), un sistema informático subacuático que intenta establecer un vocabulario compartido entre humanos y delfines utilizando silbidos sintéticos asociados con objetos de interés para los delfines.
Los teléfonos inteligentes Google Pixel permiten el análisis en tiempo real con el sistema CHAT. Un Google Pixel 6 ha gestionado el análisis de los sonidos de los delfines en la investigación actual, y se planea utilizar dispositivos Google Pixel 9 en la investigación del verano de 2025. El uso de teléfonos inteligentes disponibles comercialmente también reduce la necesidad de hardware personalizado, mejora el mantenimiento del sistema, reduce el consumo de energía y disminuye el costo y el tamaño del dispositivo, lo cual es crucial para la investigación de campo en mar abierto.
Google planea compartir el modelo DolphinGemma como un modelo abierto este verano, poniéndolo a disposición de los investigadores que estudian otras especies de cetáceos. Si bien el modelo se entrenó específicamente con sonidos de delfines moteados del Atlántico, los investigadores que estudian delfines nariz de botella o delfines giradores podrían ajustarlo para su trabajo. El WDP ha llevado a cabo investigaciones submarinas sobre delfines desde 1985, creando lo que describe como el estudio de mayor duración en el mundo de una comunidad específica de delfines moteados del Atlántico salvajes en las Bahamas. Su enfoque no invasivo ha generado un conjunto de datos que contiene décadas de video y audio submarinos, junto con identidades individuales de delfines, historias de vida y comportamientos observados. Este extenso conjunto de datos etiquetados proporcionó el material de entrenamiento para DolphinGemma, cuyo objetivo es identificar patrones de sonido recurrentes, grupos y secuencias que puedan revelar estructura dentro de la comunicación de los delfines.
Nota hecha con información tomada de aquí
|