Meta Platforms Inc está listo para mejorar sus capacidades de voz con la próxima versión de su inteligencia artificial, Llama 4, según lo informado por el Financial Times. Este desarrollo se alinea con la estrategia de Meta para centrarse en los agentes de IA conversacionales en lugar de las interacciones tradicionales basadas en texto.
Meta’s Llama 4: Transformando la IA con capacidades de voz
Se espera la introducción de las características de voz mejoradas en Llama 4 en las próximas semanas, con el objetivo de facilitar un diálogo natural bidireccional donde los usuarios puedan interrumpir la IA en lugar de adherirse estrictamente a un formato de preguntas y respuestas. Este cambio demuestra el compromiso de Meta de transformar la interacción del usuario con la tecnología AI.
El CEO Mark Zuckerberg ha esbozado objetivos ambiciosos para la compañía, designando 2025 como un año crucial para su gama de productos de IA, que están en desarrollo en medio de una mayor competencia de compañías como OpenAI, Microsoft y Google. Para sustituir estas iniciativas, Meta planea invertir hasta $ 65 mil millones en 2025, centrando principalmente este gasto en la infraestructura del centro de datos.
Meta AI se acerca a 600 millones de usuarios mensuales con Llama 3.3
Junto con los avances en Llama 4, Meta está explorando la posibilidad de suscripciones premium para su asistente de IA, Meta AI, que le permitiría realizar tareas como reservas de reservas y creación de videos. La compañía también está considerando implementar publicidad paga o publicaciones patrocinadas en los resultados de búsqueda de Meta AI.
El director de productos Chris Cox indicó que Llama 4 operaría como un «modelo Omni», lo que permite que el habla funcione de forma nativa dentro del sistema, eliminando así la necesidad de traducir la voz en texto y regreso. Hizo hincapié en la importancia de esta capacidad en la Conferencia Morgan Stanley Technology, Media & Telecom, afirmando: «Creo que todavía estamos envolviendo la cabeza con lo poderoso que es».
Meta ha estado discutiendo activamente las barandillas necesarias para la última producción del modelo de LLAMA al tiempo que evalúa si disminuir estas restricciones. Estas discusiones se presentan en medio de presiones competitivas, ya que los rivales como Operai y el XAI de Elon Musk también hacen avances en la implementación de características de voz, incluidas las ofrendas de personalidad distintas de OpenAI y Grok 3, que presenta un «modo desquiciado» que responde de manera deliberadamente objetable.
El año pasado, Meta abordó las críticas sobre su Modelo de Llama 2que había sido reacio a responder consultas benignas al presentar una versión más flexible en LLAMA 3. La integración de los comandos de voz también es una característica clave de las gafas inteligentes de meta de meta, que han ganado popularidad entre los consumidores, lo que indica aún más la estrategia de la compañía para posicionar a los auriculares livianos como los dispositivos principales de calculación del futuro.
Crédito de imagen destacado: Dima Solomin/Unsplash