Voz, audio y transcripción

Voz, audio y transcripción

Herramientas de inteligencia artificial orientadas al procesamiento del lenguaje oral, la transcripción automática, la síntesis de voz y la edición de audio, que facilitan la accesibilidad, la documentación de actividades académicas y el apoyo a la docencia, la investigación y la gestión universitaria. Nota institucional del bloque Estas herramientas facilitan la transcripción, síntesis y edición de audio, y contribuyen a la accesibilidad y documentación académica. Su uso debe realizarse respetando la protección de datos, el consentimiento informado y los principios de uso responsable de la inteligencia artificial.

OpenAI Whisper

Website / Sistema de reconocimiento automático del habla desarrollado por OpenAI para la transcripción de audio en múltiples idiomas.

Ámbito principal de uso:

  • Uso transversal
  • Adecuado para la transcripción de clases, entrevistas, reuniones académicas y materiales audiovisuales.

Finalidades recomendadas:

  • Transcripción automática de clases, seminarios y sesiones formativas.
  • Transcripción de entrevistas para investigación cualitativa y análisis posterior.
  • Conversión de reuniones y eventos académicos en texto para actas o seguimiento.
  • Generación de subtítulos para vídeos educativos y materiales audiovisuales.
  • Apoyo a la accesibilidad mediante transcripciones y subtitulado multilingüe.
  • Transcripción de audios en múltiples idiomas para análisis o documentación académica.
  • Obtención de borradores de transcripción para edición y corrección humana posterior.
  • Indexación y búsqueda de contenido en grabaciones a partir de texto transcrito.

Modelo de acceso:

  • Gratuito / De pago
  • Disponible como modelo de código abierto para uso local y también mediante servicios/API de pago según consumo.

Condiciones de uso:

  • Uso permitido
  • Puede utilizarse para la transcripción de contenidos, respetando la normativa de protección de datos y el consentimiento de las personas participantes.
  • Las funcionalidades disponibles y las condiciones específicas de uso pueden variar según la versión, la modalidad de uso (local o servicio) y la configuración del entorno.
  • Se recomienda anonimizar o proteger información sensible y revisar la transcripción final antes de su difusión o archivo.

Uso de los datos:

  • Bajo
  • En uso local, el procesamiento del audio se realiza sin envío de datos a servidores externos.
  • El tratamiento de los datos puede variar según la modalidad de uso (local o servicio/API) y la configuración del entorno, de acuerdo con las condiciones del proveedor.

Otter.ai

Website / Herramienta de transcripción automática y generación de notas a partir de reuniones, clases y conversaciones.

Ámbito principal de uso:

  • Gestión y comunicación institucional
  • Especialmente indicada para la elaboración de actas, seguimiento de reuniones y documentación de sesiones académicas.

Finalidades recomendadas:

  • Transcripción automática de reuniones, clases y conversaciones en tiempo real o a partir de grabaciones.
  • Generación de notas estructuradas y resúmenes para actas y seguimiento de acuerdos.
  • Identificación de temas tratados y puntos clave para documentación rápida de sesiones.
  • Búsqueda y localización de fragmentos específicos dentro de transcripciones extensas.
  • Apoyo a la accesibilidad mediante transcripciones y subtitulado de contenidos orales.
  • Organización de transcripciones por reuniones, proyectos o temáticas para gestión documental.
  • Compartición de notas y transcripciones para trabajo colaborativo y revisión posterior.
  • Creación de registros y documentación de sesiones académicas, seminarios o entrevistas.

Modelo de acceso:

  • Freemium
  • Ofrece una versión gratuita limitada y planes de pago con funcionalidades avanzadas.

Condiciones de uso:

  • Uso permitido con limitaciones
  • Debe utilizarse con consentimiento previo de las personas participantes en la grabación y respetando la normativa de protección de datos.
  • Las funcionalidades disponibles y las condiciones específicas de uso pueden variar según el plan o licencia de acceso y la configuración de la cuenta.
  • Se recomienda evitar la grabación de información sensible y revisar las transcripciones antes de su difusión o archivo.

Uso de los datos:

  • Medio
  • Los audios se procesan en servidores externos conforme a las políticas del proveedor.
  • El tratamiento de los datos (almacenamiento, retención y uso para mejora del servicio) puede variar según el plan o licencia y la configuración de la cuenta.

Speechify

Website / Herramienta de texto a voz basada en inteligencia artificial que convierte documentos escritos en audio.

Ámbito principal de uso:

  • Aprendizaje y docencia
  • Especialmente útil como apoyo a la accesibilidad y a diferentes estilos de aprendizaje.

Finalidades recomendadas:

  • Conversión de textos académicos en audio para facilitar el estudio y la revisión de contenidos.
  • Apoyo a la accesibilidad para personas con dificultades de lectura o necesidades específicas.
  • Escucha de artículos, apuntes y documentos durante actividades complementarias (movilidad, repaso).
  • Mejora de la comprensión lectora mediante lectura asistida y control de velocidad.
  • Apoyo a la revisión de textos propios detectando errores de coherencia o fluidez al escucharlos.
  • Transformación de materiales docentes en formatos alternativos para aprendizaje flexible.
  • Creación de audios para recursos educativos, guías de estudio o materiales de apoyo.
  • Adaptación del aprendizaje a distintos estilos mediante opciones de voz, ritmo y formato.

Modelo de acceso:

  • Freemium
  • Dispone de acceso gratuito con limitaciones y planes de pago con voces y funciones avanzadas.

Condiciones de uso:

  • Uso permitido
  • Puede emplearse como apoyo a la accesibilidad y al estudio individual.
  • Las funcionalidades disponibles y las condiciones específicas de uso pueden variar según el plan o licencia de acceso y la configuración de la cuenta.
  • Se recomienda respetar los derechos de autor de los textos convertidos y evitar el tratamiento de información sensible.

Uso de los datos:

  • Medio
  • Los textos se procesan en servidores externos para la generación de audio, de acuerdo con las condiciones del proveedor.
  • El tratamiento de los datos (almacenamiento, retención y uso para mejora del servicio) puede variar según el plan o licencia y la configuración de la cuenta.

Descript

Website / Plataforma de edición de audio y vídeo asistida por inteligencia artificial, con funciones de transcripción, edición basada en texto y síntesis de voz.

Ámbito principal de uso:

  • Uso transversal
  • Adecuada para la edición de materiales audiovisuales educativos, divulgativos e institucionales.

Finalidades recomendadas:

  • Transcripción automática de audio y vídeo para edición y accesibilidad.
  • Edición de audio y vídeo mediante modificación directa del texto transcrito.
  • Eliminación automática de muletillas, pausas y ruido para mejorar calidad de audio.
  • Generación de subtítulos y captions para contenidos educativos y divulgativos.
  • Creación de clips y fragmentos destacados para redes, microcontenidos o comunicación.
  • Síntesis de voz y ajuste de locución para guiones, narraciones o recursos didácticos (según funciones).
  • Producción y mejora de podcasts, entrevistas y vídeos explicativos con flujos simplificados.
  • Preparación de materiales audiovisuales con formato final listo para publicación o difusión.

Modelo de acceso:

  • Freemium
  • Ofrece acceso gratuito limitado y planes de pago con funcionalidades avanzadas.

Condiciones de uso:

  • Uso permitido con limitaciones
  • Puede utilizarse para la edición de audio y vídeo, revisando siempre los contenidos generados automáticamente.
  • Las funcionalidades disponibles y las condiciones específicas de uso pueden variar según el plan o licencia de acceso y la configuración de la cuenta.
  • Se recomienda obtener consentimiento cuando se editen grabaciones con personas identificables y verificar derechos de uso de materiales y voces generadas.

Uso de los datos:

  • Medio
  • Los contenidos se procesan en servidores externos de acuerdo con las políticas del proveedor.
  • El tratamiento de los datos (almacenamiento, retención y uso para mejora del servicio) puede variar según el plan o licencia y la configuración de la cuenta.