Las empresas ahora están escribiendo informes diseñados para lectores de inteligencia artificial, y eso debería preocuparnos | Big data

METROMe llamó la atención el título de un documento de trabajo publicado por la Oficina Nacional de Investigación Económica (NBER): Cómo hablar cuando una máquina está escuchando: divulgación corporativa en la era de la IA. Así que hice clic y descargué, como hace uno. Y luego empezó a leer.

El documento es un análisis de las presentaciones 10-K y 10-Q que las empresas públicas estadounidenses están obligadas a presentar ante la Securities and Exchange Commission (SEC). El 10-K es una versión del informe anual de una empresa, pero sin las fotos brillantes y el bombo publicitario: el deleite de un empollón corporativo. Tiene, dice una guía, “los datos de todo y el fregadero de la cocina que puede pasar horas revisando, desde la fuente geográfica de ingresos hasta el calendario de vencimiento de los bonos que la empresa ha emitido”. Algunos inversores y comentaristas (incluido el tuyo) encuentran impenetrable el 10-K, pero para aquellos que poseen la resistencia necesaria (las grandes empresas pueden tener 10-K que abarcan varios cientos de páginas), ese es el tipo de cosas que les gusta. La presentación 10-Q es el hermano pequeño trimestral del 10-K.

La observación que desencadenó la investigación informada en el documento fue que las descargas “mecánicas” (es decir, generadas por máquinas) de presentaciones corporativas 10-K y 10-Q aumentaron de 360.861 en 2003 a aproximadamente 165 millones en 2016, cuando aparece el 78% de todas las descargas. haber sido activado por solicitud de una computadora. Una gran cantidad de investigación en IA ahora se dedica a evaluar qué tan buenas son las computadoras para extraer significado procesable de un tsunami de datos como este. Hay mucho en juego en esto, porque la salida de informes leídos por máquina es la materia prima que puede impulsar a los comerciantes algorítmicos, asesores de inversión de robots y analistas cuantitativos de todo tipo.

Los investigadores de NBER, sin embargo, analizaron el lado de la oferta del tsunami: cómo las empresas han ajustado su lenguaje y sus informes para lograr el máximo impacto con algoritmos que leen sus divulgaciones corporativas. Y lo que encontraron es instructivo para cualquiera que se pregunte cómo sería la vida en un futuro dominado por algoritmos.

Los investigadores descubrieron que “aumentar el número de lectores de máquinas e inteligencia artificial … motiva a las empresas a preparar presentaciones que sean más fáciles de procesar y analizar mediante máquinas”. Hasta ahora, tan predecible. Pero hay más: “las empresas con altas descargas de máquinas esperadas gestionan el sentimiento textual y la emoción de audio de formas adaptadas a las máquinas y a los lectores de IA”.

En otras palabras, la legibilidad de la máquina, medida en términos de la facilidad con la que un algoritmo puede analizar y procesar la información, se ha convertido en un factor importante en la elaboración de informes de la empresa. Por lo tanto, una tabla en un informe puede tener una puntuación de legibilidad baja porque su formato dificulta que una máquina la reconozca como una tabla; pero la misma tabla podría recibir una alta puntuación de legibilidad si hiciera un uso eficaz del etiquetado.

Los investigadores sostienen, sin embargo, que las empresas ahora van más allá de la legibilidad de las máquinas para intentar ajustar el sentimiento y el tono de sus informes de manera que puedan inducir a los “lectores” algorítmicos a sacar conclusiones favorables sobre el contenido. Lo hacen evitando palabras que se enumeran como negativas en los criterios dados a los algoritmos de lectura de texto. Y también están ajustando los tonos de voz utilizados en las conferencias telefónicas trimestrales estándar con analistas, porque sospechan que los que están al otro lado de la llamada están utilizando software de análisis de voz para identificar patrones vocales y emociones en sus comentarios.

En cierto sentido, este tipo de carrera armamentista es predecible en cualquier actividad humana en la que quien tenga una mejor tecnología pueda adquirir una ventaja en el mercado. Es un poco como la guerra entre Google y los llamados “optimizadores” que intentan descubrir cómo jugar con la última versión del algoritmo de clasificación de páginas del motor de búsqueda. Pero a otro nivel, es un ejemplo de cómo la tecnología digital nos está cambiando, como argumentaron Brett Frischmann y Evan Selinger en su libro. Reingeniería de la humanidad.

Después de escribir la última oración, busqué información de publicación en el libro y me encontré tratando de iniciar sesión en un sitio que, antes de que me admitiera, me exigía que resolviera un acertijo visual: en la imagen de una carretera. cruce dividido en cuadrados de 8 x 4 tuve que hacer clic en todos los cuadrados que mostraban semáforos. Así lo hice e inmediatamente se me presentó otro rompecabezas similar, que también resolví diligentemente, como un mono obediente en un laboratorio.

¿Y el propósito de este absurdo desafío? Para convencer a la computadora que aloja el sitio de que yo no era un robot. En otras palabras, era una prueba de Turing invertida: en lugar de una máquina que intentaba engañar a un humano para que pensara que era humano, me llamaron para convencer a una computadora de que yo era humano. Estaba siendo rediseñado. El camino hacia el futuro ha dado un giro curioso.

Lo que he estado leyendo

Joan clásico
Why I Write de Joan Didion es una joya absoluta de los archivos de Revista de Londres.

Aventuras desacertadas
Charles Duhigg ha escrito un artículo en el Neoyorquino llamado Cómo los capitalistas de riesgo están deformando el capitalismo, en el que usa WeWork como un caso de estudio en la locura de la década de 2020. Básicamente, es Boo.com de nos jours, pero con giros contemporáneos de locura y codicia.

El problema con Dom
Lo que Dominic Cummings nunca entendió: la impaciencia no sustituye a la política. Así sostiene un artículo perspicaz sobre PoliticsHome de Sam Freedman.