Saltar al contenido

La puesta en marcha de IA que borra los acentos de los trabajadores del centro de llamadas: ¿está luchando contra el sesgo o perpetuándolo? | Tecnología

2 de septiembre de 2022

“HYo, buenos días. Llamo desde Bangalore, India. Estoy hablando por altavoz con un hombre con un evidente acento indio. Hace una pausa. “Ahora he habilitado la traducción de acentos”, dice. Es la misma persona, pero suena completamente diferente: fuerte y ligeramente nasal, imposible de distinguir de los acentos de mis amigos en Brooklyn.

Solo después de que hubo dicho algunas oraciones más, noté un indicio de que el software cambiaba su voz: tradujo la palabra «tecnología» con una cadencia antinatural y énfasis en la sílaba incorrecta. Aún así, era difícil no estar impresionado y perturbado.

El hombre que me llamó era un gerente de producto de Sanas, una startup de Silicon Valley que está desarrollando una tecnología de alteración de voz en tiempo real que tiene como objetivo ayudar a los trabajadores de los centros de llamadas de todo el mundo a sonar como occidentales. Es una idea que recuerda la película de comedia negra de 2018 Sorry to Bother You, en la que un colega mayor le aconseja a Cassius, un hombre negro contratado para ser vendedor telefónico, que «use su voz blanca». La idea es que imitar el acento suavizará las interacciones con los clientes, «como si la policía los detuviera», dice el trabajador mayor. En la película, Cassius rápidamente adquiere una “voz blanca”, y sus números de ventas se disparan, dejando una sensación incómoda.

Los acentos son un obstáculo constante para millones de trabajadores de centros de llamadas, especialmente en países como Filipinas e India, donde toda una industria de «neutralización de acentos» intenta capacitar a los trabajadores para que suenen más como los clientes occidentales a los que llaman, a menudo sin éxito.


Recomendado: ¿Qué es el Big data?.


Como se informó en SFGate esta semana, Sanas espera que su tecnología pueda proporcionar un atajo. Usando datos sobre los sonidos de diferentes acentos y cómo se corresponden entre sí, el motor de inteligencia artificial de Sanas puede transformar el acento de un hablante en lo que pasa por otro, y en este momento, el enfoque está en hacer que los no estadounidenses suenen como estadounidenses blancos.

Sharath Keshava Narayana, cofundador de Sanas, me dijo que su motivación para el software se remonta a 2003, cuando comenzó a trabajar en un centro de llamadas en Bangalore, enfrentó discriminación por su acento indio y se vio obligado a llamarse a sí mismo «Nathan». Narayana dejó el trabajo después de unos meses y abrió su propio centro de llamadas en Manila en 2015, pero la incomodidad de esa primera experiencia “se quedó conmigo durante mucho tiempo”, dijo.

Marty Massih Sarim, presidente de Sanas y veterano de la industria de los centros de llamadas, dijo que el trabajo de los centros de llamadas debe considerarse como un «cosplay», que Sanas simplemente está tratando de mejorar. “Obviamente, es más barato recibir llamadas en otros países que en Estados Unidos, eso es para las compañías Fortune 100, Fortune 500, Fortune 1,000. Es por eso que todo el trabajo ha sido subcontratado”, dijo.

“Si ese cliente está molesto porque su factura es alta o su cable no funciona o su teléfono no funciona o lo que sea, generalmente se sentirá frustrado tan pronto como escuche un acento. Van a decir, quiero hablar con alguien en Estados Unidos. Los centros de llamadas no enrutan las llamadas a Estados Unidos, por lo que ahora el agente se encarga de la mayor parte de eso. Simplemente no reciben el respeto que merecen desde el principio. Así que ya comienza como una conversación realmente difícil. Pero si podemos eliminar el hecho de que existe ese sesgo, ahora es una conversación, y las personas terminan la llamada sintiéndose mejor”.

la gente se sienta con auriculares debajo de una pancarta que dice 'la vida significa más...'

Los agentes de servicio al cliente reciben llamadas desde los EE. UU. en Bangalore. Fotografía: Namas Bhojani/AP

Narayana dijo que su software ya está siendo utilizado todos los días por unos 1.000 trabajadores de centros de llamadas en Filipinas e India. Dijo que los trabajadores podían encenderlo y apagarlo cuando quisieran, aunque el gerente del centro de atención telefónica tenía los derechos administrativos «únicamente por motivos de seguridad». Aparentemente, los comentarios de los usuarios han sido positivos: los agentes de reclamos de Narayana han dicho que se sienten más seguros en el teléfono cuando usan el software.

Sanas promociona su propia tecnología como «un paso hacia el empoderamiento de las personas, el avance de la igualdad y la profundización de la empatía». La empresa recaudó 32 millones de dólares en capital de riesgo en junio: un financiador, Bob Lonergan, dijo que el software “tiene el potencial de interrumpir y revolucionar la comunicación”. Pero también plantea preguntas incómodas: ¿la tecnología de inteligencia artificial está ayudando a las personas marginadas a superar los prejuicios, o simplemente está perpetuando los prejuicios que les dificultan la vida en primer lugar?

A Aneesh, socióloga y directora entrante de la Escuela de Idiomas y Estudios Globales de la Universidad de Oregón, ha pasado años estudiando los centros de llamadas y la neutralización del acento. En 2007, como parte de su investigación, el académico, que tiene una mezcla de acento indio y estadounidense, consiguió que lo contrataran como agente de telemercadeo en India, una experiencia que detalló en su libro de 2015 Neutral Accent: How Language, Labor and Life Become. Global.

En el centro de llamadas, fue testigo de cómo sus colegas fueron sometidos a un proceso de impuestos para cambiar sus acentos. “El objetivo es ser comprensible para el otro lado”, dijo. “El entrenamiento de neutralización que estaban haciendo solo estaba reduciendo ligeramente el grosor de los acentos regionales dentro de la India para permitir que esto sucediera”. Los trabajadores tenían que volver a aprender la pronunciación de palabras como «laboratorio», que los indios pronuncian con el acento británico en la segunda sílaba. También tuvieron que eliminar partes del inglés indio, como el uso frecuente de la palabra «señor». Tuvieron que aprender palabras únicamente estadounidenses, incluida una lista de más de 30 designaciones de calles como «boulevard», y memorizar los 50 estados y capitales de EE. UU. “Tienen que imitar la cultura y neutralizar su propia cultura”, dijo Aneesh. “Entrenar requiere mucho de ti”.

Además del salario base bajo, Aneesh dijo que una de las partes más difíciles del trabajo era verse obligada a dormir todo el día y trabajar toda la noche para adaptarse a los tiempos en los Estados Unidos, algo que los biólogos han descubierto que puede tener serios riesgos para la salud, que incluyen cáncer y partos prematuros. También aisló a los trabajadores del resto de la sociedad.

Todas estas son desigualdades que los empleadores de los centros de llamadas esperan ocultar. Incluso la forma en que las personas que llaman se conectan entre sí está completamente informatizada y diseñada para maximizar las ganancias.

El sociólogo tiene sentimientos encontrados sobre Sanas. “En un sentido estricto, es algo bueno para el aprendiz: no tienen que ser entrenados tanto. No es muy fácil que un inmigrante o un extranjero sentado en otro lugar del mundo no se entiendan por su acento. Y a veces son abusados.

“Pero a largo plazo, como sociólogo, es un problema”.

El peligro, dijo Aneesh, era que los acentos neutralizados artificialmente representaban una especie de «indiferencia a la diferencia», que disminuye la humanidad de la persona al otro lado del teléfono. “Nos permite evitar la realidad social, que es que sois dos seres humanos en el mismo planeta, que tenéis obligaciones el uno con el otro. Está apuntando a un futuro más solitario”.

Chris Gilliard, un investigador que estudia la privacidad, la vigilancia y los impactos negativos de la tecnología en las comunidades marginadas, dijo que los trabajadores de los centros de llamadas “existen para absorber la ira de los clientes enojados. Se parece mucho a otras cosas como la moderación de contenido, donde las empresas descargan los trabajos peores, más difíciles y más succionadores a personas en otros países para que los manejen”, dijo. Transformar los acentos de los trabajadores no cambiaría eso, sino que solo “satisface las creencias racistas de la gente”.

“Como muchas de las cosas que se presentan como la solución, no tiene en cuenta la dignidad o la humanidad de las personas”, dijo. “Uno de los efectos a largo plazo es el borrado de las personas como individuos. Parece un intento de reducir a todos a una voz mecánica homogeneizada que ignora toda la belleza que proviene de los idiomas, dialectos y culturas de las personas. Es algo realmente triste”.

Narayana dijo que había escuchado las críticas, pero argumentó que Sanas se acerca al mundo tal como es. “Sí, esto está mal, y no deberíamos haber existido en absoluto. Pero existen muchas cosas en el mundo, como ¿por qué existe el maquillaje? ¿Por qué la gente no puede aceptar su forma de ser? ¿Está mal, la forma en que el mundo es? Absolutamente. Pero, ¿dejamos que los agentes sufran? Construí esta tecnología para los agentes, porque no quiero que él o ella pasen por lo que yo pasé”.

La comparación con el maquillaje es inquietante. Si la sociedad, o digamos, un empleador, presiona a ciertas personas para que usen maquillaje, ¿es una elección real? Y aunque Sanas enmarca su tecnología como opt-in, no es difícil imaginar un futuro en el que este tipo de «maquillaje» algorítmico esté más disponible, e incluso sea obligatorio. Y muchos de los problemas que describe Narayana a partir de su propia experiencia de trabajo en un centro de llamadas (el mal trato de los empleadores, la sensación degradante de tener que usar un nombre falso) no cambiarán con la tecnología.

Después de nuestra entrevista, envié por correo electrónico una demostración de sonido de la tecnología de Sanas a Aneesh para conocer su reacción. “Al escucharlo de cerca, me di cuenta de que había un toque de emoción, cortesía y sociabilidad en la voz de la persona que llamó originalmente”, respondió. Eso desapareció en la versión transformada digitalmente, «que suena un poco robótica, plana y, ejem, neutral».