La clonación de voz es de creciente interés para los ciberdelincuentes

La tecnología de clonación de voz se está volviendo cada vez más eficiente y atrayendo un interés creciente de los ciberdelincuentes.

Cuando Tim Heller escuchó por primera vez su voz clonada, dijo que era tan precisa que “me quedé boquiabierto … fue impresionante”, informó en una entrevista a la BBC.

La clonación de voz implica el uso de un programa de computadora para crear una copia sintética y adaptativa de la voz de una persona. A partir de una grabación de una persona hablando, el software puede reproducir su voz diciendo cada palabra o frase escrita en un teclado.

Los últimos avances en tecnología han hecho que el audio generado por computadora sea increíblemente preciso. El software puede capturar no solo los acentos, sino también el timbre, el tono, el ritmo, la fluidez del habla y la respiración.

https://media.ambito.com/p/e36413aa4a72cecb47f49937dfda0754/adjuntos/239/imagenes/038/308/0038308465/1200x1200/smart/ciberdelito-audio-iajpg.jpg

Y la voz clonada se puede personalizar para representar cualquier emoción como ira, miedo, felicidad, amor o aburrimiento.

Heller, un actor y locutor de 29 años de Texas, hace de todo, desde representar personajes de dibujos animados, contar audiolibros y documentales, hablar en videojuegos y doblar avances de películas, recurrió a la clonación de voces para probar el futuro de su carrera.

Dice que puede permitirle que consiga más trabajo. Por ejemplo, si alguna vez tiene una reserva doble, puede ofrecer su clon de idioma para hacer uno de los trabajos.

“Si me contratan para otro trabajo … puedo posicionar mi ‘sincronización’ [como él llama a su clon de voz] como una opción que puede ahorrar tiempo a los clientes y generar ingresos pasivos para mí”, mencionó.

Para clonar su voz, Heller recurrió a una empresa de Boston llamada VocaliD, una de las empresas en crecimiento que ofrece este servicio. VocaliD fue fundada por su directora ejecutiva, Rupal Patel, quien también es profesora de ciencia y trastornos de la comunicación en Northeastern University.

La profesora Patel fundó la empresa en 2014 como una extensión de su trabajo clínico para desarrollar voces artificiales para pacientes que no pueden hablar sin ayuda, como las personas que han perdido la voz después de una operación o enfermedad.

Ella dice que la tecnología, impulsada por inteligencia artificial, software que puede “aprender” y adaptarse por sí solo, ha avanzado mucho en los últimos años. Esto llamó la atención de los locutores.

“También nos especializamos en la creación de voces personalizadas con acentos más diversos”, dice la profesora Patel. “Hicimos voces transgénero, hicimos voces neutrales en cuanto al género … la tecnología debería ser la forma en que todos hablamos, todos tenemos acentos y voces únicos”.

La clonación de idiomas también se puede utilizar para traducir las palabras de un actor a diferentes idiomas, lo que podría significar, por ejemplo, que las compañías cinematográficas estadounidenses ya no necesiten contratar actores para producir versiones dobladas de sus películas para su distribución en el extranjero.

La empresa canadiense Resemble AI afirma que ahora puede convertir voces en inglés clonadas en otros 15 idiomas. El director ejecutivo, Zohaib Ahmed, dice que el software requiere tan solo 10 minutos de grabación de voz para crear una copia de alta calidad de la voz de una persona.

“Cuando la IA aprende tu voz, aprende muchas propiedades … como el timbre, el tono y la intensidad”, dice. “Pero también aprende miles de otras propiedades [de la voz de una persona] que pueden no ser muy obvias para nosotros”.

Si bien la creciente sofisticación de la clonación de voz tiene un potencial comercial obvio, también ha suscitado preocupaciones crecientes de que podría usarse en delitos cibernéticos para engañar a las personas de las que otra persona está hablando.

https://contactcenterhub.es/wp-content/uploads/2021/07/george-prentzas-SRFG7iwktDk-unsplash-768x512.jpg

Además de los videos falsos generados por computadora, la clonación de voz también se conoce como “deepfake”. Y el experto en ciberseguridad Eddy Bobritsky dice que las voces sintéticas son “un gran riesgo de seguridad”.

“Cuando se trata de correos electrónicos o mensajes de texto, se sabe desde hace años que es muy fácil fingir ser otra persona”, dice el director de la empresa israelí Minerva Labs. “Pero hasta ahora, una de las formas más comunes de asegurarse de que se conozcan ha sido hablar con alguien en quien confía y conoce bien por teléfono”.

Bobritsky dice que eso ahora está cambiando. “Por ejemplo, si un jefe llama a un empleado para pedirle información confidencial y este reconoce la voz, la respuesta inmediata es hacer lo que se le pide. Este es un camino para muchos delitos cibernéticos”.

De hecho, el Wall Street Journal informó de uno de esos casos en 2019 en el que supuestamente se engañó a un ejecutivo británico para que transfiriera 220.000 euros (260.000 dólares; 190.000 libras esterlinas) a estafadores utilizando una copia clonada de la voz de su jefe alemán.

“Deben tomarse medidas para hacer frente a esta nueva tecnología y las amenazas que plantea”, añadió Bobritsky.

De hecho, empresas de todo el mundo ya lo están haciendo, según el sitio web de inteligencia artificial Venture Beat.

Estas empresas pueden monitorear el sonido para ver si está mal y buscar signos reveladores como repetición, ruido digital y el uso de ciertas oraciones o palabras.

Mientras tanto, los gobiernos y los organismos encargados de hacer cumplir la ley también están investigando el problema. El año pasado, Europol, la agencia de aplicación de la ley de la Unión Europea, instó a los Estados miembros a realizar “inversiones significativas” en tecnología de detección de falsificaciones. Y en Estados Unidos, California ha prohibido su uso en campañas políticas.

De vuelta en Texas, Tim Heller afirma que, aunque todavía no ha vendido su voz clonada, “varios clientes diferentes han mostrado interés en él”.

https://www.bbc.com/news/business-57761873
La académica estadounidense, la profesora Patel es una experta en clonación de voz.

Pero, ¿tiene miedo de perder trabajo en las voces sintéticas de otros a largo plazo?

“No me preocupa que me deje desempleado”, dice. “Realmente creo que siempre habrá un lugar para la verdadera voz humana. El objetivo de ‘doblar’ [su clon de él] no es reemplazarme a mí ni a nadie más, sino actuar como una herramienta más en mi negocio”.

Rebecca Damon, vicepresidenta ejecutiva del Screen Actors Guild, dice que el otro gran problema con la clonación de voz es que a las emisoras se les paga adecuadamente por hacerlo.

“La clonación de voz podría ser una nueva industria emocionante y potencialmente lucrativa para nuestros miembros”, dice. “Para nosotros, sin embargo, sigue siendo crucial que las emisoras reciban una remuneración justa y puedan aceptar el uso de su voz”.

“Con este fin, estamos monitoreando de cerca la evolución de la clonación de idiomas y trabajando con nuestros miembros para identificar las barreras que deben existir para que esta tecnología desarrolle su potencial como un nuevo campo de trabajo.

El Sr. Heller agrega que el problema con los precios de los clones de voz es que “este es el ‘salvaje oeste’ de la voz en off”. 

“En mi opinión, lo más importante en las negociaciones de precios y contratos [para la voz artificial] es que no todos los derechos y usos se otorgan de manera permanente”, aseguró al final de la entrevista de la BBC.

https://www.bbc.com/news/business-57761873

Smartket
Logo