Google LLC está implementando una serie de herramientas para que los desarrolladores integren el aprendizaje automático y la inteligencia artificial en sus aplicaciones utilizando modelos y soluciones de IA de alto rendimiento.
En Google I/O, la conferencia anual de desarrolladores de la empresa, se anunciaron varias herramientas nuevas para TensorFlow. TensorFlow es una biblioteca de software gratuita y de código abierto para el aprendizaje automático y la inteligencia artificial que se centra especialmente en el entrenamiento y la inferencia de redes neuronales en muchas arquitecturas diferentes, desde servidores hasta dispositivos móviles.
Google está agregando una mayor compatibilidad con los modelos de IA, incluidos los modelos de IA generativa y de difusión de imágenes, a través de TensorFlow para los desarrolladores para que puedan integrarlos más fácilmente en sus aplicaciones utilizando la biblioteca. La IA generativa se ha vuelto enormemente popular recientemente con la introducción del chatbot ChatGPT de OpenAI LP, que es capaz de mantener conversaciones aparentemente humanas, y la difusión estable de IA que genera arte, capaz de crear obras de arte hermosas y surrealistas.
Keras, una biblioteca de Python de alto nivel para interactuar con TensorFlow, está recibiendo dos actualizaciones destinadas a facilitar que los desarrolladores agreguen capacidades de inteligencia artificial a sus aplicaciones con solo unas pocas líneas de código. El primero es KerasCV, para visión artificial, y el segundo es KerasNLP, para procesamiento de lenguaje natural.
Ya sea que un desarrollador quiera recurrir a una IA que genera texto o una IA que genera imágenes, puede usar KerasCV o KerasNLP, y con solo unas pocas líneas de código, puede proporcionar un aviso y recibir un resultado directamente en su aplicación. Dado que estas nuevas incorporaciones son parte de Keras, tiene acceso completo al ecosistema TensorFlow.
Google también actualizó DTensor, una herramienta especializada para entrenar modelos de IA a escala que permite el escalado paralelo. A medida que los modelos de IA se hacen más grandes, el entrenamiento se vuelve más difícil porque no se pueden entrenar en un solo dispositivo y, tradicionalmente, los desarrolladores han tenido que dividirlos o fragmentarlos en múltiples procesadores, ya sean unidades de procesamiento de gráficos o unidades de procesamiento de tensor.
Con esta actualización, DTensor permite un entrenamiento y un ajuste fino más grandes y de mayor rendimiento, y está a la par con los puntos de referencia de la industria para el entrenamiento de grandes conjuntos de datos. Como resultado, los desarrolladores pueden estar seguros de que pueden preparar sus modelos de IA de manera más rápida y eficiente.
Dado que gran parte del trabajo de aprendizaje automático comienza con la investigación, Google también facilitó que los investigadores introdujeran su desarrollo en TensorFlow al mover sus modelos de JAX, un poderoso marco para transformar funciones numéricas, en TensorFlow usando una interfaz de programación de aplicaciones llamada JAX2TF. Eso significa que los investigadores que están desarrollando modelos completamente nuevos pueden continuar haciéndolo, y cuando estén listos para entrar en producción, pueden canalizarlos a través de la API y estarán listos para comenzar.
Google también está implementando un espacio de creación de soluciones de inteligencia artificial y aprendizaje automático llamado ML Hub. En este centro, los desarrolladores, ingenieros y partes interesadas pueden definir lo que quieren hacer y sus casos de uso, y Google les brindará la educación, las plantillas, los módulos y las herramientas para crear soluciones de IA a medida del ecosistema de Google.
Google tiene numerosas herramientas diferentes para incorporar el aprendizaje automático y la inteligencia artificial en las aplicaciones de los desarrolladores, pero es muy complejo y disperso, lo que puede dificultar descubrir lo que un desarrollador podría querer para alcanzar un resultado deseado en particular.
MediaPipe facilita la implementación del aprendizaje automático en dispositivos móviles
No toda la IA ocurre en granjas de servidores gigantes. Algunos modelos son lo suficientemente pequeños para ejecutarse en dispositivos informáticos mucho más limitados, como teléfonos móviles, y para hacerlo más fácil, Google ha actualizado MediaPipe.
MediaPipe facilita la creación, personalización e implementación de soluciones de aprendizaje automático en el dispositivo para computación portátil basada en el perímetro, como las que podrían operar en un dispositivo móvil, escritorio o web. Mediante el uso de capacidades en el dispositivo, el aprendizaje automático puede realizar la detección de gestos, como observar los movimientos de la mano y la cara, lo que a su vez habilita capacidades potentes para los dispositivos. También se puede utilizar para muchas otras funciones, como la traducción automática, el desenfoque de fondos y muchos otros usos.
Un caso de uso particular para MediaPipe y los modelos de IA más pequeños es cómo se puede usar para la accesibilidad, especialmente para las personas que no tienen la capacidad de usar sus extremidades para acceder a los dispositivos. Con ese fin, Google desarrolló “Proyecto Gameface”, una interfaz de control de computadora que utiliza expresiones faciales que pueden controlar los movimientos del mouse en los videojuegos para ayudar a los jugadores discapacitados.
Google se asoció con Lance Carr, un jugador con una rara forma de distrofia muscular. Su casa se quemó, lo que destruyó el equipo que normalmente usaba para jugar juegos como “World of Warcraft”. Los ingenieros de Google comenzaron a usar MediaPipe para permitir que una cámara web controlara su experiencia de juego; por ejemplo, levantar las cejas para hacer clic y arrastrar una boca abierta o mover un labio hacia un lado para mover un cursor.
Todo esto se puede hacer en una sola máquina, sin necesidad de nada extremadamente poderoso y restauró la capacidad de Carr para volver a jugar y volar a través de Azeroth una vez más.
Project Gameface representa solo una de las muchas posibilidades potenciales de la IA portátil, pero es muy poderosa. “¿Controlar mi computadora con caras graciosas? Es bastante impresionante”, dijo Carr.
Imagen: Pixabay
Su voto de apoyo es importante para nosotros y nos ayuda a mantener el contenido GRATIS.
Un clic a continuación respalda nuestra misión de proporcionar contenido gratuito, profundo y relevante.
Únete a nuestra comunidad en YouTube
Únase a la comunidad que incluye más de 15,000 expertos de #CubeAlumni, incluido el CEO de Amazon.com, Andy Jassy, el fundador y CEO de Dell Technologies, Michael Dell, el CEO de Intel, Pat Gelsinger, y muchas más luminarias y expertos.
GRACIAS