Aplicando Transfer Learning a modelos de lenguaje natural

Maria Hernandez Procesamiento de datos

Dentro de la Inteligencia Artificial, el Procesamiento de Lenguaje Natural (NLP por sus siglas en inglés) ha sido uno de los campos clave desde los orígenes. Al fin y al cabo, el lenguaje es una de las cosas más ligadas a  la inteligencia humana. En los últimos años este campo ha sufrido una nueva revolución semejante a la que hace …

El valor de la incertidumbre en la detección de anomalías

Jose Antonio Rodriguez Serrano Procesamiento de datos

El desarrollo de la Inteligencia Artificial en el sector financiero impulsa la creación de nuevos productos basados en datos, que en muchas ocasiones van ligados a una nueva forma de relación entre los clientes y sus entidades financieras. En este sentido, una de las principales tendencias está relacionada con la creación de servicios personalizados y de productos que nos permiten …

Explicando a humanos la fiabilidad de los algoritmos

Jose Antonio Rodriguez Serrano Procesamiento de datos

Los sistemas de Machine Learning (aprendizaje automático) tienen un problema: son imperfectos y, a veces, se equivocan. Y los humanos tenemos un problema: aún no estamos acostumbrados a trabajar con resultados imperfectos. En 2018, coincidiendo con la celebración de la copa del mundo de fútbol,  una empresa se aventuró a pronosticar la probabilidad que tendría cada equipo de convertirse en …

Un único modelo para categorizar texto y sugerir etiquetas

Pau Batlle Procesamiento de datos

Siguiendo con el proyecto que inicié durante mi estancia en prácticas en BBVA Data & Analytics en 2017, que se describe en este otro artículo, es el momento de poner el foco en explicar el trabajo realizado como continuación a esta investigación durante mi segundo periodo de prácticas en la compañía. El problema que intentamos resolver, y que mostramos en …

Agregando política a la propagación de la mora en la economía

Jordi Nin Procesamiento de datos

La propagación de la mora no puede ser entendida únicamente teniendo en cuenta las relaciones proveedor-cliente como un conjunto de nodos y bordes estáticos. Las políticas de estas relaciones y la información del entorno juegan un importante papel en cómo se propagará una crisis económica. Un grupo de científicos de BBVA Data & Analytics ha analizado estas cuestiones en un …

Recomendaciones para un Científico de Datos que quiera iniciarse en Sistemas de Recomendación

E052179 Procesamiento de datos

Como Científico de Datos, se espera que seas capaz de construir todo tipo de productos de datos. En muchas ocasiones se trata de identificar tendencias de negocio sencillas (pero muy valiosas) extraídas a través de consultas y limpieza de datos; y, a veces, uno tiene que aplicar algoritmos de aprendizaje automático más sofisticados para predicción, clasificación o incluso recomendación. Sin …

Clasificación de Texto Financiero: un Análisis de los diferentes Métodos de Embedding de Palabras

Pau Batlle Procesamiento de datos

Durante los últimos dos veranos he trabajado como becario en BBVA Data & Analytics, un tiempo en el que he desarrollado un trabajo que me gustaría explorar en este artículo. Lo que sigue es un resumen técnico de los aprendizajes adquiridos trabajando con embedding de palabras para las categorizaciones de pequeñas descripciones en transacciones financieras. La clasificación de texto adquiere …

Desarrollamos un motor de predicción con incertidumbre en colaboración con Google Cloud

Jairo Mejía Procesamiento de datos, Noticias y referencias

El reciente white paper publicado por BBVA Data & Analytics en colaboración con Google Cloud presenta el desarrollo de un modelo de Deep Learning para la predicción de series temporales. El modelo implementado incorpora la incertidumbre en las predicciones, lo que sin duda supondrá una mejora de la experiencia del cliente en diferentes productos y servicios que ofrece actualmente la …

Self-Service Performance Tuning for Hive

Angel Puerto Procesamiento de datos

Hive is a very powerful data warehouse framework based on Apache Hadoop. The two together provide stable storing and processing capabilities for big data analysis. In this article, we will analyze how to monitor metrics, tune and optimize the workflow in this environment with Dr. Elephant. Hive is designed to enable easy data summarization, ad-hoc queries, and big data analysis. …

Predicciones con Incertidumbre en Modelos de Aprendizaje Profundo

Axel Brando Procesamiento de datos

En BBVA trabajamos desde hace tiempo para aprovechar los datos transaccionales de nuestros clientes y los modelos de Deep Learning para ofrecer una experiencia bancaria digital personalizada y relevante a nuestros clientes. Nuestra capacidad de prever los ingresos y gastos recurrentes en una cuenta es una de las más diferenciadoras de la industria. Este tipo de previsión ayuda a los …

Ningún Problema Demasiado Grande; Ninguna Solución Demasiado (Computacionalmente) Pequeña

Jairo Mejía Procesamiento de datos

En BBVA Data & Analytics abordamos constantemente los problemas de negocio con matemáticas aplicadas, estadística o econometría. No hay problema demasiado grande; pero resulta que la solución a veces puede ser demasiado grande. Esta premisa llevó a dos de nuestros científicos de datos, Jordi Nin y Jordi Aranda, a explorar una forma de mejorar la calidad de los conocimientos que …

Una Introducción “peculiar” al Deep Learning

Favio Vázquez Procesamiento de datos

Hay increíbles introducciones, cursos y entradas en blogs sobre Deep Learning. Voy a nombrar algunas de ellas en las secciones de recursos, pero esta es una clase diferente de introducción: una introducción peculiar. ¿Pero por qué peculiar? Tal vez porque no sigue la estructura “normal” de un post de Deep Learning, donde se empieza con las matemáticas, luego se pasa …

Como Tener un Entorno con Spark en Menos de 30 Segundos Gracias a Docker

Edgar Pérez Sampedro Procesamiento de datos

Seguro que alguna vez habéis querido “cacharrear” con alguna tecnología, pero vuestro afán de aprender seguro que se ha visto mermado por la dificultad de instalar todo lo necesario en vuestro sistema operativo. En este artículo explicaremos cómo empezar a jugar con spark sin importar el sistema operativo que tengamos y sin necesidad de sufrir ni tener que pegarse ni …

No se Trata de Aprendizaje Profundo, sino de Aprender a Representar

Beatriz Alonso Procesamiento de datos

Recientemente, hemos creado un grupo de trabajo dedicado a Deep Learning (Aprendizaje Profundo). Los grupos de trabajo ofrecen oportunidades para compartir internamente ideas, conceptos, recursos, código, etc. Además, se pretende promover el uso de Machine Learning (Aprendizaje Automático) en BBVA. Recuerdo vivamente cómo José Antonio Rodríguez, uno de los impulsores de este grupo de trabajo, nos dijo entonces:”Deberíamos llamarlo el …

Una Solución Rentable y Escalable: Sistema de Recomendación basado en Filtros Colaborativos

Ivan Fernández Procesamiento de datos

El pasado jueves (26 de septiembre) tuvimos la oportunidad de presentar una colaboración entre BBVA Data & Analytics y BEEVA en el Theatre of Partners durante la AWS Summit Madrid 2017. En la conferencia, presentamos un enfoque rentable para los sistemas de recomendación basados ​​en el filtro colaborativo (RS), que escalan a millones de usuarios y un millón de productos. …

Limpieza y análisis exploratorio de datos con Apache Spark y Optimus

Favio Andre Vazquez Prieto Procesamiento de datos

Los datos obsoletos, inexactos o duplicados no impulsarán soluciones optimizadas de datos. Cuando los datos son inexactos, las necesidades son más difíciles de rastrear y nutrir, y las ideas pueden ser defectuosas. Los datos en los que basamos una estrategia Big Data deben ser precisos, actualizados, lo más completos posible y no deben contener entradas duplicadas. Los datos limpios resultan …

There is no Such Thing as a Certain Prediction

Leonardo Baldassini Procesamiento de datos

One question that naturally springs up when imagining what Artificial Intelligence (AI) can bring to the banking industry, and one that we get asked fairly often, is: Can you predict people’s expenses? As it is often the case, such a simple question is in fact only apparently simple. The prediction of personal financial transactions may range from estimating the amount …

What Does Wind Look Like?

Jordi Aranda Procesamiento de datos

In our recent collaboration with United Nations Global Pulse to measure the economic impact of natural disasters we analyzed purchase behaviors when Hurricane Odile struck Baja California Sur in September 2014. As part of the study we visualized the strength of the winds and showed how the hurricane initially formed until finally making landfall. In this article I describe how we …

Recommender systems: Marketing gets personal

Jerry Finn Procesamiento de datos

Did you ever get the feeling that Amazon understands your desires better than your spouse? Did you ever search for a vacation in Galicia on Google and then notice you see more ads trying to sell you sea food and raincoats? This is thanks to recommender systems brought to you by the phenomenon of Big Data. In today’s world, businesses …

Reference Generation: A Method for Venue Recommendation

Jerry Finn Procesamiento de datos

Being concise is often a virtue and sometimes it is also a necessity. It’s especially interesting to explain something as complex as data science in just 6 minutes. This was the idea behind the Pecha-Kucha talks at the NetSci2015 conference of the Network Science Society in Zaragoza, Spain. The Pecha-Kucha presentation style recommends 20 slides for 20 seconds each, forcing …

Predicting Regional Economic Indices

Jerry Finn Procesamiento de datos

It’s not unusual for people to complain about the timeliness of macroeconomic statistics. Governments are constantly revising GDP figures and unemployment rates well after the fact. It seems when it comes to economic statistics it’s tough to make predictions about the past. Other limitations are that the nature of the data that is used as input to official government economic …