Sonix.ai revisión

Cada herramienta que transcribe se dirige a un nicho específico y Sonix ha elegido aquellas que graban reuniones o presentaciones y luego necesitan una versión escrita para buscar o difundir.

Por lo tanto, podría ser igualmente útil para un estudiante como lo podría ser para un ejecutivo, entregando transcripciones que pueden indexarse ​​fácilmente para referencia futura.

Pero para tener éxito en estas tareas, el software debe ser preciso y asequible..
Es Sonix.ai esa herramienta, y puede un servicio en línea competir con una aplicación instalada?

  • ¿Quieres probar Sonix.ai? Echa un vistazo a la página web aquí

(Crédito de la imagen: Sonix)

Planes y precios

Al igual que con muchos servicios de transcripción, el modelo de costos de Sonix se basa en el tiempo. Específicamente, la duración de cualquier grabación que cargue al servicio para procesar, y el costo de ese recurso es de $ 10 por hora si usa su servicio estándar de pago por uso.

El costo por hora se puede reducir a $ 5 si se suscribe al servicio de suscripción Premium por $ 22 por mes para cada usuario. Y, hay descuentos por volumen disponibles para aquellas empresas que requieren más de 100 horas por mes transcritas.

El plan estándar tiene las características más básicas, y Premium agrega otras adicionales como acceso multiusuario y uso compartido de equipo. Y Enterprise tiene todo lo que Premium ofrece con mucha administración adicional y un modelo de soporte mejorado.

A medida que avanzan los servicios de transcripción, Sonix es uno de los más caros, y ciertamente no es algo que la mayoría de los estudiantes o usuarios domésticos puedan pagar razonablemente.

(Crédito de la imagen: Sonix)

Diseño

El sitio my.sonix.ai usa un diseño excepcionalmente limpio, y crear una cuenta es gratis.

En el momento de la redacción, este es un servicio exclusivamente basado en la web, y Sonix no tiene una aplicación móvil para capturar y enviar al procesamiento de grabaciones de audio..

Sin embargo, como cubriremos tarde, hay formas simples de solucionar este problema que resuelven un poco la falta de una aplicación móvil.

El punto de partida para cualquier trabajo de transcripción es el panel de Sonix.ai, donde puede ver el audio que ya se ha transcrito y agregar nuevos para procesar.

Debido a que este sistema fue diseñado para múltiples usuarios, incluye un sistema de carpetas virtuales para organizar las transcripciones de la forma que se considere adecuada..

Al hacer clic en «cargar», el usuario accede a una página donde se pueden colocar varios archivos en el sistema, y ​​si la cuenta tiene crédito suficiente, se pueden procesar.

Todos los formatos de archivos de audio estándar son compatibles, incluidos wav, mp3, mp4a, aiff, acc, ogg y wma, y ​​también puede cargar algunas estructuras de empaque de video. El tamaño máximo del archivo es de 4 GB, por lo que antes de cargar un archivo de video de gran resolución 4K, le recomendamos que use alguna otra herramienta para dividir el audio y acelerar la carga..

Una buena manera de acelerar la carga es utilizar una instalación de almacenamiento en la nube como Google Drive, One Drive, Box o Dropbox y vincularla directamente a la cuenta. También puede enviar un correo electrónico al sistema usando Gmail, como un medio para crear un flujo de trabajo más elegante que soltar archivos en una página web.

Esta automatización se proporciona a través de Zapier, lo que permite una integración mucho más amplia si la empresa que la utiliza ha invertido en esa tecnología para conectar sus procesos comerciales..

Otro buen detalle es que, junto con el archivo de audio o video, puede incluir la transcripción existente, como un medio para completar más rápidamente el proceso y mejorar la precisión.

(Crédito de la imagen: Sonix)

Otro buen detalle es que, junto con el archivo de audio o video, puede incluir la transcripción existente, como un medio para completar más rápidamente el proceso y mejorar la precisión.

Debido a la naturaleza del procesamiento basado en la nube, es imposible juzgar cuán rápido o lento puede ser el procesamiento, pero Sonix.ai es relativamente rápido en nuestra experiencia. Por lo general, se tarda entre 10% y 20% del tiempo en transcribir mientras dura la grabación. Por lo tanto, completar una grabación de 10 minutos generalmente toma menos de 2 minutos.

No es necesario que siga el procesamiento, ya que el sistema le enviará una notificación por correo electrónico cuando finalice el trabajo, junto con un enlace a la nueva transcripción..

Una vez procesado el archivo, puede abrirlo dentro y editar la página para revisar los resultados, y también exportar el texto en una amplia gama de formatos útiles, incluidos aquellos definidos como subtítulos por algunas aplicaciones.

El número de idiomas y dialectos admitidos por el sistema es 36, y eso incluye varios países de habla inglesa, francesa, cantonesa, mandarín, portugués y español, junto con todos los idiomas comunes de Europa occidental y oriental, junto con algunos asiáticos y árabes..

(Crédito de la imagen: Sonix)

Grabaciones

Junto con el trabajo que se realizó en la IA necesaria para interpretar los ruidos que hacen los humanos, probablemente la página de Grabaciones representa un esfuerzo de codificación significativo aquí.

Aquí, tanto el audio como su transcripción asociada pueden compararse y mejorarse manualmente con detalles de los cambios del hablante y soluciones a malas interpretaciones.

Para cualquiera que esté trabajando en una transcripción para pulir el texto, esta página proporciona la ubicación de la superficie del carbón. Tiene sentido que se haya hecho un esfuerzo en esta parte, ya que es muy fácil de usar y seguir..

En un intento de dirigir al usuario hacia dónde podría haber problemas, Sonix.ai codificará con colores el contenido para resaltar aquellas secciones en las que tiene menos confianza. Esta característica puede ser útil, aunque Sonix.ai puede cometer errores incluso en aquellas partes en las que considera que la transcripción tiene el estado «Muy seguro».

Los mejores aspectos de esta página son cómo se sincronizan la reproducción de audio y el texto, de modo que al colocar el cursor en el texto se mueve la posición de reproducción a la misma sección.

Junto con la edición simple, también es posible resaltar secciones en varios estilos y tomar notas para acompañar la transcripción..

También puede modificar el código de tiempo, especialmente útil si la grabación comienza con una pausa larga o un preámbulo no deseado.

(Crédito de la imagen: Sonix)

Exactitud

Sonix describe Sonix.ai como «El mejor software de transcripción automatizado con tecnología de punta de IA».

Dadas nuestras pruebas, describiríamos este producto como altamente dependiente de la calidad de la grabación y muchos otros factores que no pueden controlarse fácilmente.

Al procesar nuestras grabaciones históricas clásicas de discursos, a algunos oradores les resultó muy difícil, incluso si nos parecían claros..

Estos resultados estaban en marcado contraste con algunas grabaciones más concurrentes, donde la precisión era aceptable pero apenas estelar.

Llegamos a la conclusión de que el enfoque adoptado por Sonix hace varias suposiciones que pueden funcionar o no, dependiendo del orador y la calidad de la grabación..

Lo fascinante es que el servicio codificará por colores su transcripción según la confianza que tenga en lo que se dice, y este autoanálisis es muy revelador..

En algunas circunstancias, identificará correctamente que una sección puede ser sospechosa, pero en otras partes, confía en que la sección se transcribió completamente mal.

Algunos problemas comunes parecen arrojarle una bola curva, y uno de ellos son las personas que no hablan prosa gramaticalmente perfecta. En un esfuerzo por hacer que su discurso sea más directo, han eliminado algunas palabras de sus oraciones, para lograr un estilo más dramático. Cuando Sonix las transcribe, parece decidido a agregar esas palabras de nuevo para que se ajusten a su modelo gramatical interno, en lugar de lo que realmente se dijo.

La transcripción se lee mejor como documento, pero no es realmente representativa de lo que se dijo.

Sonix es ciertamente mejor cuando la calidad de la grabación y la claridad del altavoz es alta, como lo probamos con un pequeño clip de Stephen Fry leyendo a Harry Potter. Pero, no es posible tener siempre ese control sobre la calidad del sonido, y aun así cometió errores con esa prueba.

Otra área problemática son los nombres formales y las palabras técnicas o abreviaturas. Estos pueden abordarse agregándolos al diccionario personalizado, pero esto requiere trabajo para que el sistema pueda darse cuenta mejor cuando se usan nombres o acrónimos.

Para aquellos que necesitan una palabra de transcripción perfecta, Sonix tiene una selección de transcriptores profesionales asociados que pueden trabajar a través de una grabación y abordar esos problemas, pero esto de alguna manera frustra el propósito de la transcripción procesada.

(Crédito de la imagen: Sonix)

Seguridad

El enfoque de la seguridad de Sonix.ai son los servidores donde se procesa el audio y se guardan las transcripciones..

Todo el tráfico se encripta usando TLS (Seguridad de la capa de transporte) y una vez que los archivos están en el servidor que está protegido por múltiples capas de firewall, la protección contra intrusiones y todos los datos están rodeados por el cifrado del lado del servidor AES-256. Y, la compañía promete que los empleados no tendrán acceso a grabaciones o transcripciones a menos que se les otorgue un permiso explícito para que tengan eso.

El problema crítico con este enfoque es que un simple inicio de sesión y contraseña pueden eludirlo todo. Sonix.ai no tiene autenticación de dos factores, y no tiene un registro fácilmente accesible de quién accede a los archivos y cuándo.

Desde el punto de vista de la seguridad, esto podría considerarse una dependencia excesiva de la integridad de quienes utilizan el sistema para no compartir grabaciones con otros fuera del negocio o retener los archivos potencialmente confidenciales cuando abandonan la empresa..

En resumen, la seguridad debe ser mejor, y el seguimiento o la actividad de los usuarios tienen mayor prioridad..

Veredicto final

Considerando el costo relativamente alto, esperábamos que Sonix se desempeñara mejor de lo que lo hizo.

Tal vez tuvimos mala suerte con nuestras opciones de cosas para transcodificar, pero aún así parecía haber una cantidad excesiva de errores.

En el lado positivo de esta ecuación, es rápida y es un sistema notablemente fácil de usar, aunque recomendamos ejecutar algunas grabaciones de ejemplo a través de esta solución antes de comprometerse a una suscripción.

El mayor problema con Sonix es el alto costo, e incluso si es la herramienta adecuada para sus requisitos particulares, existen medios más económicos para convertir el audio en texto en otro lugar.