La inteligencia artificial de Google es capaz de convertir documentos en podcast: cómo aprovecharla

Ahora la IA también hace pódcast, aunque para ello habrá que alimentarla con archivos. La herramienta que permite convertir PDF en pódcast pertenece a Google y se llama Open NotebookLM.

Para quienes no estén familiarizados con el experimento de IA de Google, NotebookLM es una plataforma de asistente de investigación que toma los documentos cargados por el usuario y utiliza Gemini 1.5 pro para ofrecer un enfoque basado primero en la toma de notas para interactuar con la información que se encuentra en el documento.

Al tratarse de una herramienta a la que se puede acceder desde el navegador no hay problemas de compatibilidad entre Windows, Android o macOS. Cualquier usuario puede utilizar Open NotebookLM desde el móvil, la notebook o una tableta.

El software genera un resumen de todos los documentos cargados en el cuaderno del usuario y permite a éste formular preguntas sobre el material. Una vez procesada la información, NotebookLM responde con citas apropiadas de los documentos cargados.

La intefaz de Open NotebookLM.La intefaz de Open NotebookLM.

El auge de esta tecnología ha permitido que se creen soluciones a problemas actuales. En el caso de Open NotebookLM su mayor ventaja es que cualquier archivo PDF pasa a convertirse en un pódcast.

Para el procesamiento de texto el modelo que se utiliza es Llama 3.1, el límite de caracteres es de 100 mil lo que supone que no debería haber problema a la hora de subir archivos extensos.

Eso sí, puede que temáticas de cientos de páginas demasiado específicas no sean capaces de ser procesadas en su totalidad. Y si bien su alcance es amplio, la alternativa de código abierto puede carecer de las pruebas y la rigurosidad que suelen acompañar a los productos comerciales.

Los usuarios deben abordar estas herramientas con precaución, sobre todo cuando manejen documentos sensibles o confidenciales.

Con un sólido rendimiento

Está basado en Google GeminiEstá basado en Google Gemini

Y aunque no es tan apto como Gemini, MeloTTS proporciona un sólido rendimiento de texto a voz para el proyecto, y los usuarios pueden ajustar el tono de la IA entre “divertido” y “formal”. Además, admite más de diez idiomas, con español, francés y alemán entre las opciones.

La aparición de Open NotebookLM representa un cambio significativo en el panorama de la IA. Es un ejemplo de cómo se está reduciendo la barrera de entrada para crear aplicaciones sofisticadas de IA, lo que permite que surjan soluciones más diversas e innovadoras.

Puede que no todo el mundo vea la utilidad de esta herramienta, pero para aquellas personas que se encuentren estudiando la realidad es completamente diferente.

Pero es que las posibilidades van más allá de eso, pudiendo subir documentos PDF, añadir una dirección URL de la que obtener la información, preguntar sobre algo en específico del documento, seleccionar el tono de la respuesta, la duración del audio y el idioma entre el que se encuentra el castellano.

Lo interesante a la hora de crear el pódcast es que la herramienta genera un archivo de audio en el cual dos personas discuten la temática de la que trata el documento. Sí, crear un pódcast con todas las letras que luego los usuarios pueden escuchar mientras realizan otras tareas y así facilitarles el aprendizaje de esta temática.

SL

Más Noticias

Relacionadas