insideBIGDATA Últimas noticias – 29/06/2020

En esta columna regular, le traeremos las últimas noticias de la industria centradas en nuestros principales temas de interés: grandes datos, ciencia de los datos, aprendizaje automático, IA y aprendizaje profundo. Nuestra industria se acelera constantemente con nuevos productos y servicios que se anuncian todos los días. Afortunadamente, estamos en estrecho contacto con los proveedores de este vasto ecosistema, por lo que estamos en una posición única para informarle sobre todo lo que es nuevo y emocionante. Nuestra enorme base de datos de la industria está creciendo todo el tiempo, así que manténgase atento a las últimas noticias que describen la tecnología que puede hacer que usted y su organización sean más competitivos.

data.world da a las empresas una comprensión más profunda de sus datos
con capacidades técnicas automatizadas de linaje

data.world, la empresa de catálogos de datos empresariales nativos de la nube, lanzó nuevas capacidades de linaje de datos que ofrecen una visión totalmente automatizada y completa de las relaciones de datos y de cómo fluyen a través de una organización. Impulsado a través de una asociación con MANTA, los usuarios pueden analizar y comprender más fácilmente cómo se conectan los datos y la información – incluyendo el linaje empresarial y técnico de tablas, columnas, vistas, consultas, transformaciones, adiciones, ediciones y más. Esta granularidad proporciona transparencia y confianza en el flujo de datos y el consumo de una organización, en última instancia, mejorar el impacto y el análisis de la causa raíz, la solución de problemas y los esfuerzos de previsión.


Recomendado: ¿Qué es el Big data?.


“La gente necesita entender y confiar en los datos que alimentan sus informes y análisis. Pero asignarle un contexto, validar el origen y la administración de los datos y el análisis, y colaborar con otros usuarios de datos es un desafío”, dijo Jon Loyens, cofundador y Jefe de Producto de data.world. “Añadir capacidades de linaje técnico a nuestro catálogo permite a los usuarios obtener detalles increíblemente granulares sobre las relaciones de los datos, para que puedan sentirse más seguros sobre cómo, cuándo y dónde deben aplicar los datos”.

El nuevo vector actiano para el Hadoop permite el análisis en tiempo real y operacional

Actian, líder en almacenamiento de datos en nubes híbridas e integración de datos, anunció la disponibilidad general de Actian Vector para Hadoop, su base de datos SQL actualizada, diseñada para proporcionar análisis de alto rendimiento y actualizaciones de datos en tiempo real explícitamente para Hadoop. Al permitir análisis en tiempo real y operativos que no eran posibles anteriormente en Hadoop, el nuevo Vector para Hadoop proporciona apoyo para el aprendizaje automático, la gestión optimizada de la carga de trabajo y una rampa de acceso a la nube sin problemas para que las empresas puedan sacar el máximo provecho de sus inversiones en Hadoop.

Las limitaciones en las infraestructuras de los lagos de datos existentes, combinadas con las condiciones actuales del mercado y las presiones presupuestarias, están impidiendo que los líderes de la tecnología de la información obtengan el máximo valor de sus inversiones en los lagos de datos de Hadoop. Con este desafío en mente, Actian desarrolló Vector para Hadoop, haciendo posible que las empresas aprovechen al máximo los conjuntos de datos a su disposición.

“El Hadoop está diseñado para la escala, pero se necesitan conocimientos a la velocidad de la luz, lo que puede significar la diferencia entre el crecimiento de la empresa o el fracaso”, dijo Emma McGrattan, SVP de Ingeniería de Actian. “Con eso en mente, Actian Vector para Hadoop está haciendo posible que los lagos de datos de Hadoop existentes de nuestros clientes asuman nuevos desafíos de análisis operacional, que las aplicaciones tradicionales de Hadoop SQL han luchado históricamente por resolver”.

Pattern89 anuncia una predicción: La IA que simula el rendimiento de los anuncios antes del lanzamiento de las campañas

Pattern89, una plataforma de marketing de inteligencia artificial, anuncia el fin de las pruebas A/B con su nueva solución, Pattern89 Predict. Pattern89 Predict simula elementos publicitarios creativos para predecir las combinaciones publicitarias de mayor rendimiento de una marca con una precisión de más del 95%. Pattern89 Predict es el nuevo estándar para los vendedores, reemplazando las largas y costosas pruebas A/B para determinar el éxito de un anuncio antes de …el lanzamiento. Sube rápidamente cientos de elementos publicitarios a la interfaz de Predict, y analizará millones de combinaciones para predecir qué componentes publicitarios específicos se desempeñarán mejor en los medios sociales. Predecir desbloquea las ideas creativas para más de 49.000 dimensiones de anuncios.

“Pattern89 Predict” encuentra creativos digitales ganadores, antes de que se publiquen los anuncios, lo que significa que las pruebas A/B son ahora cosa del pasado. La eficiencia y la precisión son más importantes que nunca, y estamos dando a los vendedores un camino claro hacia adelante, mientras eliminamos las oportunidades de perder tiempo y dinero,” dijo R. J. Talyor, CEO y fundador de Pattern89. “Los equipos de mercadeo no pueden darse el lujo de desperdiciar nada. Nuestras predicciones iniciales les dan a los vendedores confianza en su creatividad y, en última instancia, en sus retornos de publicidad social”.

MariaDB da el poder del análisis a millones de personas de forma gratuita

MariaDB® Corporation anunció la disponibilidad general del Servidor Comunitario MariaDB 10.5, una importante novedad que pone el análisis de alto rendimiento en manos de millones de personas que utilizan la popular base de datos de código abierto. En un esfuerzo por generalizar la analítica y hacerla tan popular como el motor transaccional de MariaDB, la compañía añadió un nuevo motor de almacenamiento columnar nativo al servidor de la base de datos de la comunidad y un nuevo conector nativo en Python de MariaDB e integración con Microsoft Power BI. Juntas, estas nuevas capacidades proporcionan a los usuarios tradicionales de MariaDB y a los científicos de datos de todo el mundo un poderoso análisis. Todas las nuevas capacidades analíticas en el Servidor de la Comunidad MariaDB 10.5 están disponibles de forma gratuita y de uso ilimitado para ampliar la adopción de procesamiento transaccional y analítico híbrido, y de enfoques analíticos modernos.

“El análisis de datos es un componente esencial de cualquier aplicación moderna”, dijo Gregory Dorman, vicepresidente de sistemas distribuidos y análisis de la Corporación MariaDB. “Los clientes esperan que las aplicaciones les proporcionen conocimientos, comparaciones históricas, predicciones y automatización para tomar decisiones mejores y más inteligentes y ofrecer una experiencia más intuitiva”. Con las nuevas capacidades analíticas nativas y completamente integradas, los usuarios de la comunidad de MariaDB tienen ahora una solución rentable y lista para ser usada para almacenar y acceder a cantidades masivas de datos en fracciones de segundo”. Transformará la forma en que todos en el mundo ven y usan MariaDB para empezar a construir aplicaciones modernas de uso diario”.

Las empresas recurren a Alation para la gestión de datos

Alation Inc., líder en soluciones empresariales de inteligencia de datos, lanzó una serie de iniciativas para adoptar el gobierno de datos como un caso de uso estratégico como parte de la visión más amplia de la compañía de transformar el catálogo de datos en una plataforma para una amplia gama de soluciones de inteligencia de datos, incluyendo la búsqueda y el descubrimiento de datos, la productividad de los analistas, el gobierno de datos, la administración de datos, el análisis y la transformación digital. Las iniciativas incluyen mejoras en la hoja de ruta del producto, asociaciones estratégicas próximas y recientemente anunciadas, una nueva metodología de gobierno activo de datos y una serie de programas de marketing.

“Estamos duplicando el gobierno de los datos en respuesta tanto a las solicitudes de nuestros clientes como a la constatación de que el catálogo de datos es el punto de apoyo ideal para aplicar el gobierno de los datos”, dijo Satyen Sangani, cofundador y director general de Alation. “Alrededor de un tercio de los clientes de Alation ya aprovechan el catálogo de datos como plataforma para el gobierno de los datos. Al trabajar con estos clientes, hemos determinado cómo impulsar nuestra estrategia de productos, nuestra estrategia de alianzas, nuestro marketing y nuestros servicios profesionales para adoptar de la mejor manera posible el gobierno de los datos como un caso de uso estratégico, todo ello como parte de nuestra visión general de transformar el catálogo de datos en una plataforma para una amplia gama de soluciones de inteligencia de datos”.

Xilinx selecciona el software Mipsology Zebra para acelerar el FPGA del Alveo U50

El innovador de software de IA Mipsology anunció que su software de aceleración de la red neural Zebra ha sido integrado en la última construcción de la tarjeta aceleradora del centro de datos Alveo U50 de Xilinx, el primer acelerador adaptable de bajo perfil de la industria con soporte PCIe Gen 4. La facilidad de uso y el alto rendimiento de Zebra permiten al Alveo U50 calcular redes neuronales convolutivas sin esfuerzo. Es el último de una serie de tarjetas Xilinx mejoradas por Zebra que permiten la aceleración de inferencia para una amplia variedad de aplicaciones de IA sofisticadas. Otras incluyen las placas Alveo U200 y Alveo U250.

“Zebra ofrece el mayor rendimiento y facilidad de uso posibles para la aceleración de la inferencia”, dijo Ludo Larzul, fundador y director ejecutivo de Mipsology. “Con el Alveo U50, Xilinx y Mipsology están proporcionando a los desarrolladores de aplicaciones de IA una tarjeta que sobresale en múltiples aplicaciones y en cada entorno de desarrollo”.

Skillsoft abre la discusión de datos con el campamento de entrenamiento de Python a todos los estudiantes

Skillsoft ha anunciado su primer campamento de iniciación en ciencias de los datos, realizado en colaboración con Data Society, líder en formación práctica en ciencias de los datos, y alojado en la plataforma de experiencia de aprendizaje inteligente de Skillsoft, Percipio. Los instructores de Data Society, que realizaron más de 3.000 horas de capacitación en 2019 con clientes como la NASA, Discover y el Departamento de Estado de los Estados Unidos, dirigirán el bootcamp. Disponible sin costo alguno para todos los estudiantes interesados, el Data Wrangling con Python Bootcamp permite a los asistentes interactuar con el instructor y recibir una instrucción personalizada de alta calidad mientras colaboran con otros en un ambiente de aula virtual.

La inscripción para el Data Wrangling de cuatro días de Skillsoft con el Python Bootcamp está abierta a todos los que estén familiarizados con el Python y tendrá lugar del 20 al 23 de julio. Disponible en línea y en el tiempo de los alumnos, todas las sesiones serán grabadas y estarán disponibles a petición si no pueden hacer una sesión en vivo, mientras que todos los inscritos también tendrán acceso a más de 7.000 cursos con la prueba de Percipio de 90 días. En un momento en que los entrenamientos y eventos en persona se detienen, este Bootcamp proporciona un valor masivo al ofrecer instrucción virtual personalizada de alta calidad, que es crítica para retener el conocimiento en tales temas técnicos, con acceso a micro aprendizaje a demanda en una sola solución.

“Al asociarnos con Skillsoft, estamos rompiendo colectivamente las barreras en la educación de la ciencia de los datos y democratizando la adquisición de estas habilidades cada vez más esenciales”, dijo Merav Yuravlivker, CEO de Data Society. “Hemos creado Data Wrangling de Skillsoft con Python Bootcamp para asegurar que los alumnos reciban una experiencia altamente interactiva y amplias oportunidades para aplicar habilidades prácticas de programación que son fundamentales para que los científicos de datos exploren y analicen los datos”.

Olea Edge Analytics lanza EdgeWorks Platform 2.0, la forma más rápida y precisa de monitorizar el rendimiento de los contadores de agua

Olea Edge Analytics, una plataforma de computación inteligente de borde para la industria de servicios de agua, anunció el lanzamiento de EdgeWorks Platform 2.0, que combina la tecnología de cadena de bloques, la IA y el aprendizaje por máquina para proporcionar la solución más avanzada para la facturación, entrega y conservación del agua. Este importante anuncio de producto incluye una colección de nuevas características que ayudarán a las ciudades y a las empresas de servicios de agua a encontrar millones de dólares en ingresos por contadores de agua comerciales rotos, desgastados o de tamaño incorrecto. Con una mejor gestión de la energía, una nueva solución de supervisión de derivaciones y una nueva solución de gestión de la presión, EdgeWorks Platform 2.0 notifica a los clientes de un problema más rápidamente que nunca y reduce los costes de tránsito y almacenamiento de datos.

“Los trabajadores de las empresas de servicios públicos dedican mucho tiempo y dinero a identificar y diagnosticar problemas con su actual conjunto de herramientas”, dijo Dave Mackie, director general de Olea Edge Analytics. “La plataforma EdgeWorks 2.0 les permite reenfocar la mano de obra y los recursos en la reparación de los medidores para devolverles la precisión y permitirles recuperar los ingresos perdidos”.

Pepperdata anuncia la auto-escalada controlada para reducir los costos de la nube

Pepperdata, el líder en Rendimiento de la Pila de Análisis (ASP), anunció el auto-escalado gestionado en la nube con el Optimizador de Capacidades de Pepperdata versión 6.3. Si bien el autoescalado proporciona la elasticidad que los clientes exigen para sus grandes cargas de trabajo de datos, puede dar lugar a costos desorbitados. Capacity Optimizer aumenta de manera inteligente el autoescalado para garantizar que todos los nodos se utilicen plenamente antes de que se creen nodos adicionales, eliminando el desperdicio y reduciendo los costos.

“Incluso con la mejor estrategia de migración a la nube y los dedicados intentos de reducir los costos, la nube hace que la gestión de los recursos sea más difícil”, dice Ash Munshi, CEO de Pepperdata. “Pero, al aprovechar el aprendizaje de las máquinas y la gestión de la infraestructura en tiempo real, los equipos de operaciones de TI recuperan automáticamente la capacidad desperdiciada y reducen significativamente sus costos”.

erwin lanza una nueva versión del modelador de datos que define la industria para apoyar la transformación digital, la migración a la nube y la modernización de la infraestructura

erwin, Inc., la compañía de gobierno de datos, anunció la disponibilidad de la última versión de su solución de modelado de datos, erwin Data Modeler (erwin DM). La actualización presenta nuevas capacidades de automatización impulsadas por metadatos y facilita el traslado de fuentes de datos heredadas y basadas en premisas a las modernas plataformas de nube para asegurar un gobierno de datos adecuado.

erwin DM proporciona metadatos y visualización de esquemas, un proceso bien gobernado e integrado para definir/diseñar activos de datos de todo tipo, y la centralización e integración de metadatos empresariales y semánticos – todo ello para acelerar la gobernabilidad de los datos y aumentar la alfabetización y la colaboración de los datos empresariales. El diseño y la migración automatizados de los esquemas ayudan a las organizaciones a adoptar plataformas modernas de DBMS y arquitecturas de almacenes de datos.

“Como resultado de COVID 19, las empresas de todo el mundo están intensificando drásticamente sus esfuerzos de transformación digital, incluyendo el traslado de sus datos heredados a la nube para asegurar que estén más disponibles para la toma de decisiones”, dice el director general de erwin, Adam Famularo. “Así pues, seguimos invirtiendo en la tecnología de la que fuimos pioneros para garantizar que los clientes puedan comprender, diseñar y desplegar nuevas fuentes de datos, además de apoyar los esfuerzos de gobernanza e inteligencia de datos, para reducir aún más los costes de gestión de datos y los riesgos relacionados con los mismos, al tiempo que se mejora la calidad y la agilidad de la capacidad general de datos de una organización”.

Immuta lanza una oferta nativa para Databricks con características de seguridad y colaboración mejoradas

Immuta, la compañía de gobernanza de datos automatizados, anunció una mejor integración de la plataforma con Databricks, la compañía de datos e inteligencia artificial. Immuta para Databricks – una nueva oferta nativa para los clientes de Databricks – mejora la productividad de la ingeniería de datos y la seguridad de los datos mediante la automatización del control de acceso de grano fino y la protección de la privacidad de forma nativa dentro de Databricks y Delta Lake. El último lanzamiento de Immuta desbloquea nuevas oportunidades y resultados de la ciencia de los datos, simplifica el cumplimiento de las normas y mejora aún más los controles de seguridad y privacidad.

“Databricks proporciona una escalabilidad, flexibilidad, ahorro de costes y rendimiento inigualables. Sin embargo, las estrictas normas y regulaciones de protección de datos crean conformidad y limitaciones técnicas cuando se trata de utilizar datos protegidos para el análisis y la ciencia de los datos”, dijo Steve Touw, CTO de Immuta. “Los equipos de datos están expuestos a nuevos niveles de riesgo, lo que hace que sea un reto gestionar y preparar datos sensibles para que los científicos de datos accedan a ellos de una forma de auto-servicio que cumpla con las normas, pero también para que esos mismos analistas compartan y publiquen su trabajo de forma segura”. El último Immuta para Databricks mejora las capacidades de automatización necesarias para superar estos desafíos”.

Yellowbrick Data logra el siguiente nivel de escala para los almacenes de datos de la nube híbrida con la expansión de su cartera

La empresa de almacenes de datos en nube híbridos Yellowbrick Data anunció que ha alcanzado el siguiente nivel de escala para sus clientes al ofrecer capacidad de múltiples petabytes (PB) en su nueva configuración de 3 chasis de almacén de datos híbridos. El hito más reciente en la evolución del almacén de datos en nube híbrido más rápido y de mayor rendimiento de la industria, la configuración de 3 chasis demuestra el compromiso de Yellowbrick de adelantarse a las demandas de los clientes a medida que las empresas amplían su infraestructura y sus cargas de trabajo.

El producto de 3 chasis de Yellowbrick es una extensión de la familia de alto rendimiento de la compañía de soluciones integradas de software/hardware, que alimentan un almacén de datos de nubes híbrido único que puede ser consumido a través de cualquier nube privada y/o cualquier nube pública importante. Esta evolución ofrece una capacidad incomparable de almacén único con soporte para 3,6PB de datos de usuario en un factor de forma de rack de 14U. Cuando está totalmente poblado, este caso tiene un número máximo de nodos de 45 en 14U y también admite 45 consultas simultáneas de un solo trabajador en un sistema. Otras soluciones competitivas cuestan mucho más, especialmente cuando se tienen en cuenta los costes de refrigeración del centro de datos y los costes inmobiliarios.

“Yellowbrick es uno de los únicos proveedores de almacenes de datos que ofrece una verdadera escalabilidad horizontal, eclipsando otras ofertas de la competencia en términos de rendimiento, escala y facilidad de ampliación”, dijo Nick Cox, jefe de producto de Yellowbrick. “Con la configuración de 3 chasis, estamos entregando dramáticamente más almacenamiento y rendimiento en un factor de forma muy pequeño. Es el ejemplo más reciente de nuestro implacable compromiso con la innovación, algo que ha formado parte de la cultura de la empresa y de nuestro almacén de datos híbrido desde el primer día”.

Cambridge Semantics introduce la analítica geoespacial en su AnzoGraph® DB

Cambridge Semantics, un proveedor líder de software de integración y análisis de datos impulsados por gráficos, anunció la adición de análisis geoespaciales dentro de su galardonada base de datos AnzoGraph®. Esta nueva capacidad combina el poder de la analítica de localización escalable con el poder de las relaciones y el análisis en una base de datos gráfica.

Muchos proyectos de gráficos de conocimiento hoy en día incluyen la necesidad de saber acerca de la gente, las cosas y los eventos en el mundo real y donde ocurrieron. Añadir capacidades geoespaciales a la base de datos AnzoGraph DB permite a los usuarios determinar una ubicación y su relación con las fronteras, regiones, zonas u otros lugares – y luego ayudar a los usuarios a realizar cálculos y consultas sobre esas ubicaciones y sus relaciones.

Los casos de uso de la analítica geoespacial son variados y extensos. En el sector público, las comunidades pueden utilizarla para gestionar los servicios de emergencia, la cartografía, la planificación urbana y la predicción de la delincuencia. En los servicios financieros, la geoespacial es fundamental para evaluar los riesgos y determinar las zonas de riesgo. La geoespacial suele ser un factor clave para muchos otros procesos empresariales, incluidos los proyectos de IO, la evaluación de las tasas fiscales, el establecimiento de zonas de entrega y venta y la optimización de las rutas. Además, la analítica geoespacial puede ayudar a una variedad de aplicaciones de COVID-19, incluyendo el rastreo de contactos.

“La integración de la analítica geoespacial dentro de AnzoGraph DB es otro ejemplo de cómo Cambridge Semantics continúa empujando los límites de la innovación de los gráficos de conocimiento y mostrando lo que es posible con la analítica basada en gráficos”, dijo Steve Sarsfield, Vicepresidente de Producto de Cambridge Semantics. “Además, las extensas aplicaciones de la analítica geoespacial ayudarán a nuestros socios y equipos de innovación corporativa a aprovechar la geoespacial para sus aplicaciones de inteligencia a gran escala basadas en la localización”.

Sigma Computing presenta importantes actualizaciones de la solución en la nube, impulsando el análisis impulsado por la comunidad y la inteligencia de negocios

Sigma Computing, un innovador en el análisis de la nube y la inteligencia de negocios (A&BI), está impulsando un enfoque comunitario de A&BI con la última versión de su solución. Los nuevos cuadros de mando interactivos transforman el proceso de A&BI al permitir una colaboración fluida entre los usuarios de la empresa y los expertos en datos, y al permitir que los expertos del dominio alineen los esfuerzos de A&BI con las necesidades de la empresa. La nueva capacidad de incrustación de aplicaciones de Sigma permite que los cuadros de mando se incrusten en aplicaciones con funciones y permisos de acceso heredados, extendiendo el valor de Sigma a todo el ecosistema de datos de forma segura y protegida.

“Toda empresa quiere estar basada en datos, pero eso es sólo un sueño hasta que la exploración de datos, el análisis y la inteligencia de negocios sean accesibles para todos”, dijo Rob Woollen, cofundador y CTO de Sigma Computing. “En Sigma, creemos que las organizaciones que obtienen el mayor valor de las soluciones de A&BI son las que las utilizan para trabajar de forma iterativa a través de los equipos empresariales y técnicos. A diferencia de otras soluciones, Sigma ofrece a todos, no sólo a los equipos de datos, la capacidad de explorar, modelar, visualizar y enriquecer sus datos en tiempo real, a escala de la nube, de modo que puedan encontrar las respuestas en sus datos que impulsen una ventaja competitiva real más rápidamente”.

El proyecto MLflow se une a la Fundación Linux

La Fundación Linux, la organización sin fines de lucro que permite la innovación masiva a través del código abierto, anunció que MLflow, una plataforma de código abierto de aprendizaje automático (ML) creada por Databricks, se unirá a la Fundación Linux. Desde su introducción en la Cumbre Spark + AI hace dos años, MLflow ha experimentado un impresionante compromiso de la comunidad de más de 200 contribuyentes y se descarga más de 2 millones de veces al mes, con una tasa de crecimiento anual de 4x en las descargas. La Fundación Linux proporciona un hogar neutral con un modelo de gobierno abierto para ampliar la adopción y las contribuciones al proyecto MLflow aún más.

“El aumento constante de la participación de la comunidad muestra el compromiso de los equipos de datos con la construcción de la plataforma de aprendizaje de la máquina del futuro. La tasa de adopción demuestra la necesidad de un enfoque de código abierto para estandarizar el ciclo de vida del aprendizaje de máquina”, dijo Michael Dolan, VP de Programas Estratégicos de la Fundación Linux. “Nuestra experiencia en el trabajo con los más grandes proyectos de código abierto en el mundo muestra que un modelo de gobierno abierto permite una más rápida innovación y adopción a través de una amplia contribución de la industria y la construcción de consenso”.