Blog de Elogia

BIGQUERY ML: MACHINE LEARNING DESDE BIGQUERY

Por Dani Barreiro - El 16 July 2019 - 0 Comment(s)

BIGQUERY ML: MACHINE LEARNING DESDE BIGQUERY

Por Dani Barreiro - El 16 July 2019 - 0 Comment(s)

Actualmente las empresas generan miles de datos a diario, estos datos requieren ser ordenados y almacenados correctamente. De esta manera podrán ser analizados y usados con otra gran cantidad de fines. BigQuery ML es una herramienta que nos puede ayudar a garantizar que no perdamos ningún dato.  ¿Quieres saber más sobre ella? ¡Sigue leyendo!Antes de arrancar con "la chicha" queremos dar unas pinceladas de qué es BigQuery, para qué se utiliza y cómo le va a ayudar a todos nuestros clientes.... ¿listos? ¡allá vamos!

¿Qué es Google BigQuery?


El servicio web de Google BigQuery permite realizar almacenamiento y consulta de conjuntos de datos masivos con billones de filas. Su uso es sencillo y permite a los desarrolladores y analistas estudiar bases de datos (casi) en tiempo real. Realiza consultas del tipo SQL sobre conjuntos de datos que contienen terabytes de información en unos pocos segundos.
Los principales comandos para la administración de tablas se pueden encontrar en este documento de Google developers (previo registro). Se puede utilizar como si fuera un DataWarehouse, con el único inconveniente de no poder modificar ni añadir registros de forma individual.

bi-engineAhora sí, a continuación sabremos qué nos aportará BigQuery ML en nuestro día a día y porque puede ser fundamental para nuestros clientes a la hora de decidir la inversión en sus mix de canales o para saber de qué forma interactúan sus usuarios en sus plataformas.


BIGQUERY ML: MACHINE LEARNING DESDE BIGQUERY


Hace unos meses Google anunció una nueva funcionalidad de Google BigQuery llamada BigQuery ML, la cual está actualmente en Beta. Consiste en un conjunto de extensiones del lenguaje SQL que permiten crear modelos de aprendizaje automático (machine learning), evaluar su capacidad predictiva y hacer predicciones para nuevos datos directamente desde dentro de BigQuery.


Es una herramienta caracterizada por su capacidad de mejorar la productividad de los analistas de datos a través de una calidad inigualable y con un coste de administración cero, debido a que tan solo tendremos que pagar un precio muy reducido por almacenar nuestra información en BigQuery y otro pequeño importe por cada operación que hagamos.

Una de las ventajas más destacada de BigQuery ML es que para usarlo solo se necesita saber standard SQL, sin necesidad de herramientas especializadas como R o Python para entrenar modelos, por lo que hace más accesible el aprendizaje automático. Incluso se encarga por defecto de la transformación de los datos, de dividir tus datos en conjuntos de entrenamiento y de test, etc. Además, al usarse directamente en BigQuery, que es dónde están almacenados los datos, no se necesita exportar los datos a otras herramientas, lo que permite reducir el tiempo de entrenamiento de los modelos.

Por ejemplo, gracias a la vinculación con Analytics 360, podemos usar BigQuery ML para predecir si un usuario comprará o no en base a su actividad en la web.

bquery google elogia
El funcionamiento y uso de BigQuery ML 

  1. Lo primero es enviar al servicio de análisis de datos BigQuery ML los datos de tus sistemas. Con lo que BigQuery los almacena hasta el momento en el que tú quieras hacer uso de ellos.
  2. Cuando quieras realizar un análisis de datos de los mismos, BigQuery ML te proporciona un mecanismo que te otorga la posibilidad de hacer cualquier consulta sobre la información que le has enviado.
  3. Obtienes los resultados en tan solo unos segundos, independientemente del volumen de datos que se trate. Es una de las ventajas que ofrece BigQuery ML, frente a otros servicio.

Modelos admitidos en BigQuery ML

  • Regresión lineal para el pronóstico; por ejemplo, las ventas de un artículo en un día determinado. Las etiquetas tienen un valor real (no pueden ser +/- infinito o NaN).
  • Regresión logística binaria para clasificación; por ejemplo, determinar si un cliente hará una compra. Las etiquetas solo deben tener dos valores posibles.
  • Regresión logística multiclase para clasificación. Estos modelos se pueden usar para predecir varios valores posibles, como si una entrada es de "valor bajo", "valor medio" o "valor alto". Las etiquetas pueden tener hasta 50 valores únicos. En BigQuery ML, el entrenamiento de regresión logística multiclase usa un clasificador multinomial con una función de pérdida de entropía cruzada.
  • Agrupamiento de clústeres de k-means para la segmentación de datos (Beta); por ejemplo, identificar segmentos de clientes. K-means es una técnica de aprendizaje no supervisado, por lo que la capacitación del modelo no requiere etiquetas ni datos divididos para el entrenamiento o la evaluación.
  • A mayores, podremos incorporar el LTV (Value es el valor neto de los ingresos que nos genera un cliente durante el tiempo que es nuestro cliente.) para que nuestros clientes tengan un visión más completa de cómo interactúan los usuarios en la sus ecommerce
BigQuery ML será ser un antes y un después para nuestras herramientas de reporting, ya que nos brindará la posibilidad de darle más respuestas a nuestros clientes de que valor tienen nuestras campañas publicitarias en sus conversiones.
Por lo que hemos podido comprender hasta ahora, BigQuery ML es una herramienta innovadora que presenta grandes ventajas en el sector de Big Data y que está llena de oportunidades para brindarnos información muy valiosa!
Dani Barreiro
Publicado el 16 July 2019 por Dani Barreiro 0
.

  • ¿Qué empresa trata sus datos?

    ELOGIA MEDIA SL

  • ¿Por qué tratamos los datos que le pedimos?

    Tratamos sus datos para poder prestarle nuestros servicios y enviarle información sobre nuestros productos y servicios.

  • ¿Cuál es la legitimación para este tratamiento de sus datos?

    Estos datos son necesarios para llevar a cabo la prestación de los servicios que haya solicitado a través del Sitio Web.

  • ¿Se van a hacer cesiones o transferencias con sus datos?

    No, sus datos no serán objeto de cesiones a terceras empresas.

  • ¿Se utilizarán sus datos para hacer perfilados o segmentaciones?

    ELOGIA MEDIA SL podrá utilizar técnicas de profiling para poder ofrecerle publicidad acorde con sus intereses.

  • ¿Tiene dudas?

    Tanto si tiene alguna, o sugerencia, como si quiere darse de baja póngase en contacto con nosotros enviando un email a la siguiente dirección: info@elogia.net