Dataconomy ES
Subscribe
No Result
View All Result
Dataconomy ES
Subscribe
No Result
View All Result
Dataconomy ES
No Result
View All Result

NotebookLlama: Meta tiene su propio NotebookLM de código abierto

byKerem Gülen
28 octubre 2024
in Artificial Intelligence
Home Artificial Intelligence
Share on FacebookShare on Twitter

Meta ha introducido una implementación abierta de la función generar un podcast que ofrece Google en su plataforma NotebookLM. Llamado NotebookLlama, este nuevo proyecto utiliza los propios modelos Llama de Meta para la mayor parte de su procesamiento. Similar a CuadernoLMNotebookLlama permite a los usuarios crear resúmenes estilo podcast a partir de archivos de texto, como archivos PDF de artículos o publicaciones de blogs.

Cómo funciona NotebookLlama

NotebookLlama comienza creando una transcripción a partir de un archivo determinado, por ejemplo, un PDF. Luego, el sistema agrega elementos como dramatización e interrupciones para que el contenido generado se parezca más a una conversación. Después de eso, utiliza modelos abiertos de texto a voz para convertir la transcripción en audio.

La calidad de salida actual de los podcasts generados por NotebookLlama sigue siendo deficiente en comparación con la de NotebookLM de Google. Las voces tienen una notable cualidad robótica y, a menudo, hablan entre sí en momentos extraños. Sin embargo, los investigadores de Meta señalan que es posible mejorar esta calidad con modelos de conversión de texto a voz más potentes. En la página de GitHub de NotebookLlama, señalan: «El modelo de texto a voz es la limitación de cuán natural sonará».

Una posible mejora para el proyecto, según los investigadores de Meta, podría implicar que dos agentes separados debatan un tema y creen el esquema del podcast, en lugar de depender de un único modelo para manejar este aspecto. NotebookLlama, al igual que NotebookLM y otras herramientas de inteligencia artificial, también enfrenta desafíos con «alucinaciones», lo que significa que los podcasts generados a veces pueden contener información incorrecta.

Usar NotebookLlama.

NotebookLlama- Meta tiene su propio NotebookLM de código abierto
(Imagen: Meta)

Características

NotebookLlama tiene como objetivo proporcionar una versión accesible y de código abierto de NotebookLM, que ofrezca varios beneficios a los usuarios:

  • NotebookLlama es completamente de código abierto, por lo que los usuarios pueden usarlo, modificarlo y adaptarlo de forma gratuita según sea necesario.
  • El enfoque estructurado utilizado en sus cuadernos Jupyter hace que NotebookLlama sea adecuado para quienes tienen experiencia limitada en el trabajo con modelos de lenguaje grandes (LLM), indicaciones o modelos de audio.
  • Aunque la característica principal es convertir archivos PDF en podcasts, los principios detrás de NotebookLlama podrían adaptarse a otros flujos de trabajo creativos de conversión de texto a voz.

Creando un podcast con NotebookLlama

NotebookLlama utiliza cuadernos de Jupyter para guiar a los usuarios en cada paso de la creación de un podcast a partir de un archivo de texto. Aquí hay un vistazo simplificado a los pasos involucrados:

  • Paso 1: instale las bibliotecas necesarias. Los usuarios comienzan instalando las bibliotecas necesarias como Optimum, Transformers y otras dependencias.
  • Paso 2: importar bibliotecas. Los portátiles importan varias bibliotecas de Python para el procesamiento de audio, como IPython, TQDM y Torch, entre otras.
  • Paso 3: Procesar datos y generar audio. NotebookLlama genera segmentos de audio utilizando dos modelos: Bark y Parler. Estos modelos procesan indicaciones de texto y generan audio, que luego se puede ensamblar en un podcast completo.
  • Paso 4: Funciones de utilidad. El proceso incluye funciones de utilidad para generar diferentes voces de los oradores, lo que garantiza una experiencia de podcast más dinámica.
  • Paso 5: arma el podcast. Los segmentos de audio generados se combinan en el podcast final, creando un producto de audio completo que se puede compartir.

NotebookLlama todavía está en desarrollo y hay áreas donde el proyecto puede mejorar. Mejorar la calidad de los modelos de conversión de texto a voz podría mejorar en gran medida el sonido natural de los podcasts generados. Las iteraciones futuras también podrían explorar diferentes enfoques, como el uso de múltiples agentes para crear contenido más atractivo.

A pesar de estas limitaciones, NotebookLlama proporciona una forma única y de código abierto de convertir texto en contenido de audio. El enfoque también puede tener aplicaciones más allá de las simples conversiones de PDF, ofreciendo posibilidades más amplias para los creadores interesados ​​en experimentar con flujos de trabajo automatizados de conversión de texto a voz.

NotebookLlama podría convertirse en una herramienta valiosa para quienes buscan automatizar la creación de podcasts o experimentar con nuevas formas de contenido de texto a voz.


Crédito de la imagen destacada: Kerem Gülen/Ideograma

Tags: cuadernollama

Related Posts

OpenAI impone filtros de seguridad a los adolescentes mediante la predicción conductual de la edad

OpenAI impone filtros de seguridad a los adolescentes mediante la predicción conductual de la edad

21 enero 2026
Google lanza exámenes de práctica SAT gratuitos en Gemini con Princeton Review

Google lanza exámenes de práctica SAT gratuitos en Gemini con Princeton Review

21 enero 2026
Samsung filtra y luego elimina la revisión de Bixby con búsqueda Perplexity

Samsung filtra y luego elimina la revisión de Bixby con búsqueda Perplexity

21 enero 2026
Altman rompe su postura anti-publicidad con "patrocinado" enlaces debajo de las respuestas de ChatGPT

Altman rompe su postura anti-publicidad con "patrocinado" enlaces debajo de las respuestas de ChatGPT

21 enero 2026
DeepSeek revela la arquitectura MODEL1 en la actualización de GitHub antes de la V4

DeepSeek revela la arquitectura MODEL1 en la actualización de GitHub antes de la V4

21 enero 2026
Adobe lanza Object Mask con tecnología de IA para Premiere Pro

Adobe lanza Object Mask con tecnología de IA para Premiere Pro

20 enero 2026

Recent Posts

  • JWST identifica SN Eos: la supernova más distante jamás confirmada espectroscópicamente
  • Netflix lanza votación interactiva en tiempo real para el estreno en vivo de Star Search
  • Snap paga millones para resolver una demanda por adicción a adolescentes
  • El CEO de Anthropic critica a EE. UU. y Nvidia por las ventas de chips de IA a China
  • Netflix planea rediseñar su aplicación móvil en 2026 para impulsar la participación diaria de los usuarios

Recent Comments

No hay comentarios que mostrar.
Dataconomy ES

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.