¿Quién revisa mi modelo? Cómo aplicar revisión por pares a proyectos de Data Science

BBVA AI Factory Team Formas de trabajo

“Más ven cuatro ojos que dos”. Este aforismo tradicional del refranero castellano, también existente en otros idiomas, nos recuerda que son más convenientes aquellas decisiones tomadas por varias personas, frente a las que se sustentan en una única opinión. Una fase crítica en el ámbito de la investigación académica se basa también en esta idea. Se trata del proceso de …

Lecturas recomendadas: desde la academia a la divulgación científica

Joan Llop Noticias y referencias

Con motivo del día y la semana del libro, desde BBVA AI Factory hemos querido recuperar todas esas lecturas que nos han enseñado algo nuevo y que nos permiten mejorar nuestras habilidades y ampliar nuestros horizontes. Como podéis imaginar, eso son muchos libros y referencias, por lo que hemos votado aquellas más relevantes para nosotros. Este año hemos vuelto a …

Aplicando Transfer Learning a modelos de lenguaje natural

Maria Hernandez Procesamiento de datos

Dentro de la Inteligencia Artificial, el Procesamiento de Lenguaje Natural (NLP por sus siglas en inglés) ha sido uno de los campos clave desde los orígenes. Al fin y al cabo, el lenguaje es una de las cosas más ligadas a  la inteligencia humana. En los últimos años este campo ha sufrido una nueva revolución semejante a la que hace …

De BBVA Data & Analytics a BBVA AI Factory

BBVA AI Factory Noticias y referencias, Visión y Valores

Hace diez años, un grupo de mentes inquietas del BBVA crearon un pequeño programa de innovación con el fin de explorar las oportunidades de la explotación de los datos financieros. Podría parecer que una década no es demasiado tiempo, pero cuando hablamos de tecnología es como si el tiempo pasara el doble de rápido. En 2011 aún no habíamos visto …

El valor de la incertidumbre en la detección de anomalías

Jose Antonio Rodriguez Serrano Procesamiento de datos

El desarrollo de la Inteligencia Artificial en el sector financiero impulsa la creación de nuevos productos basados en datos, que en muchas ocasiones van ligados a una nueva forma de relación entre los clientes y sus entidades financieras. En este sentido, una de las principales tendencias está relacionada con la creación de servicios personalizados y de productos que nos permiten …

Explicando a humanos la fiabilidad de los algoritmos

Jose Antonio Rodriguez Serrano Procesamiento de datos

Los sistemas de Machine Learning (aprendizaje automático) tienen un problema: son imperfectos y, a veces, se equivocan. Y los humanos tenemos un problema: aún no estamos acostumbrados a trabajar con resultados imperfectos. En 2018, coincidiendo con la celebración de la copa del mundo de fútbol,  una empresa se aventuró a pronosticar la probabilidad que tendría cada equipo de convertirse en …

La diversidad y la inclusión como decisión política

Joan Llop Visión y Valores

En el sector de la ciencia y la tecnología observamos una realidad indiscutible: siguen faltando mujeres que equilibren la balanza de género. Se trata de un hecho objetivo y medible en la gran mayoría de compañías del sector y, aunque desde BBVA Data & Analytics apostamos claramente por la diversidad y la inclusión, esta realidad también nos afecta directamente. Frente …

Una búsqueda aleatoria en el NeurIPS 2019

Pablo de Jesús Campos Viana AI Factory estuvo allí

Durante el pasado mes de diciembre tuvimos la oportunidad de atender la edición número 33 del NeurIPS, una de las conferencias más prestigiosas del mundo en machine learning. La conferencia se celebró en Vancouver, Canadá, durante la semana del 8 al 14 de diciembre, y estuvo repleta de tutoriales, workshops, demostraciones, presentaciones orales y sesiones de póster. En este artículo …

Un repaso al avance en analítica de grafos durante 2019

Rafael Hernández Recopilaciones AI Factory

Como ya anunciamos en este artículo, el equipo de Graph Analytics de la Factoría de Inteligencia Artificial del BBVA facilita el uso de algoritmos de grafos en el banco a través de la creación de una biblioteca interna de software y la entrega de activos de datos de grafos. Ahora, pasados los primeros días del 2020, este artículo pretende ser …

Un único modelo para categorizar texto y sugerir etiquetas

Pau Batlle Procesamiento de datos

Siguiendo con el proyecto que inicié durante mi estancia en prácticas en BBVA Data & Analytics en 2017, que se describe en este otro artículo, es el momento de poner el foco en explicar el trabajo realizado como continuación a esta investigación durante mi segundo periodo de prácticas en la compañía. El problema que intentamos resolver, y que mostramos en …

Un equipo de la AI Factory presenta un software interno para el análisis de relaciones

Santiago Basaldúa Noticias y referencias

Un campo de las matemáticas fundado por Leonhard Euler hace 283 años con su problema “Los siete puentes de Königsberg” está cambiando la manera en que abordamos la analítica centrada en el cliente en BBVA. En lugar de estudiar clientes, corporaciones, directores, productos o cajeros automáticos como objetos estáticos con atributos estándar o “etiquetas” como las que surgen de la …

Qué vimos (y qué presentamos) en KDD 2019

Jose Antonio Rodriguez Serrano AI Factory estuvo allí

Una de las herramientas que incluye la app de BBVA es la que permite a los clientes conocer una estimación de los gastos e ingresos recurrentes para el próximo mes. Saber qué día vas a recibir el cargo del seguro del coche o una transferencia recurrente -y su importe- es clave porque ayuda a planificar mejor tus cuentas y controlar …

Agregando política a la propagación de la mora en la economía

Jordi Nin Procesamiento de datos

La propagación de la mora no puede ser entendida únicamente teniendo en cuenta las relaciones proveedor-cliente como un conjunto de nodos y bordes estáticos. Las políticas de estas relaciones y la información del entorno juegan un importante papel en cómo se propagará una crisis económica. Un grupo de científicos de BBVA Data & Analytics ha analizado estas cuestiones en un …

Acelerar el flujo de trabajo en Ciencia de Datos

Jose Antonio Rodriguez Serrano Formas de trabajo

Existen muchas respuestas posibles a la pregunta “¿qué hace un científico de datos?”. Una que nos gusta especialmente es que un científico de datos es quien se encarga de trabajar con los datos para ayudar en la reducción de ineficiencias en productos, servicios o procesos. Así, vemos empresas de venta al por menor incorporando científicos de datos para mejorar la …

Hablando sobre desigualdad con Esteban Moro

Joan Llop Charlas AI Factory

El pasado día 10 de abril tuvimos la oportunidad de conocer de cerca el proyecto “The Atlas of Inequality”, un proyecto desarrollado por el grupo de Human Dynamics del MIT Media Lab en colaboración con el Departamento de Matemáticas de la Universidad Carlos III de Madrid. Uno de los principales investigadores de este proyecto es Esteban Moro, docente asociado de …

Organizamos un Data Challenge de modelado financiero ¡Participa!

Jairo Mejía Noticias y referencias

Como científicos de datos, nos encanta participar en algunas iniciativas fuera del alcance de nuestros trabajos diarios. Esto nos brinda la capacidad de aprender cosas nuevas que no están directamente relacionadas con nuestro ámbito de experiencia y tener una nueva perspectiva de problemas analíticos complejos. Al mismo tiempo, este tipo de experiencias nos permite colaborar con compañeros que normalmente trabajan …

Mujer y diversidad, claves para la innovación tecnológica

Ana Pombo Visión y Valores

Con motivo de la semana de la mujer, desde BBVA Data & Analytics hemos querido crear un espacio de debate liderado por nuestras compañeras en el que, aportando datos y con la inestimable presencia de Cristina Aranda, cofundadora de Mujeres Tech, pudiéramos constatar la situación de la mujer en distintos ámbitos y, en concreto, en el mundo de la ciencia …

Los mejores eventos para un científico de datos viajero

Jairo Mejía Noticias y referencias

¡Lo entendemos! Te encantan las reuniones en las que se comparte la mejor Ciencia de Datos y el conocimiento analítico avanzado. Los trabajos de investigación, los talleres, los carteles, los ponentes de primer nivel y los casos de uso aplicados son una excelente manera de obtener nuevas perspectivas e ideas. También sabemos que te encanta la posibilidad de disfrutar de …

El #10yearchallenge de la Ciencia de Datos

Jairo Mejía Recopilaciones AI Factory

Hace diez años, el término “Ciencia de datos” era solo un 7% de lo que es hoy en día en las tendencias de Google. Era casi inexistente en las noticias y solo ganaba tímidamente terreno en la narrativa corporativa. Uno tiene que volver al 2010 para ver una primera definición completa de la disciplina emergente de la Ciencia de Datos …

Recomendaciones para un Científico de Datos que quiera iniciarse en Sistemas de Recomendación

E052179 Procesamiento de datos

Como Científico de Datos, se espera que seas capaz de construir todo tipo de productos de datos. En muchas ocasiones se trata de identificar tendencias de negocio sencillas (pero muy valiosas) extraídas a través de consultas y limpieza de datos; y, a veces, uno tiene que aplicar algoritmos de aprendizaje automático más sofisticados para predicción, clasificación o incluso recomendación. Sin …

Lo más relevante de la ciencia de datos en 2018

Jairo Mejía Recopilaciones AI Factory

El año que estamos a punto de dar por finalizado ha sido uno de los más importantes en cuanto al desarrollo de tecnologías de aprendizaje autónomo (machine learning). Durante el 2018, gran parte del debate se ha centrado en cómo seguir perfeccionando estas tecnologías y pasar de la simple optimización al afianzamiento de una disciplina avanzada en Ciencia de Datos, …

Los Mejores Cursos Online en Ciencia de Datos

Jairo Mejía Noticias y referencias

El perfil profesional del científico de datos está en auge, y, como consecuencia, cada vez tenemos una mayor oferta de formación a nuestra disposición, tanto para aquellos que buscan especializarse en campos específicos con un nivel avanzado como para los que desean iniciarse en el mundo de la ciencia de datos. Además de los cursos y másteres presenciales, que ya …

Clasificación de Texto Financiero: un Análisis de los diferentes Métodos de Embedding de Palabras

Pau Batlle Procesamiento de datos

Durante los últimos dos veranos he trabajado como becario en BBVA Data & Analytics, un tiempo en el que he desarrollado un trabajo que me gustaría explorar en este artículo. Lo que sigue es un resumen técnico de los aprendizajes adquiridos trabajando con embedding de palabras para las categorizaciones de pequeñas descripciones en transacciones financieras. La clasificación de texto adquiere …

Desarrollamos un motor de predicción con incertidumbre en colaboración con Google Cloud

Jairo Mejía Procesamiento de datos, Noticias y referencias

El reciente white paper publicado por BBVA Data & Analytics en colaboración con Google Cloud presenta el desarrollo de un modelo de Deep Learning para la predicción de series temporales. El modelo implementado incorpora la incertidumbre en las predicciones, lo que sin duda supondrá una mejora de la experiencia del cliente en diferentes productos y servicios que ofrece actualmente la …

Cómo las Iniciativas Basadas en Datos pueden Salvar Vidas Infantiles

Jairo Mejía Historias con datos

Millones de acontecimientos e historias ocurren cada día en Ciudad de México, una de las megalópolis más densamente habitadas del mundo. Cada uno de estos acontecimientos genera datos anónimos que, monitorizados y utilizados de forma adecuada, podrían resultar en una mejora sustancial de la vida de sus habitantes. No sólo esto, sino que además la ciudad podría alentar la participación …

Self-Service Performance Tuning for Hive

Angel Puerto Procesamiento de datos

Hive is a very powerful data warehouse framework based on Apache Hadoop. The two together provide stable storing and processing capabilities for big data analysis. In this article, we will analyze how to monitor metrics, tune and optimize the workflow in this environment with Dr. Elephant. Hive is designed to enable easy data summarization, ad-hoc queries, and big data analysis. …

Desarrollando Software de Código Abierto en una Gran Empresa

Santiago Basaldúa Noticias y referencias

El mundo funciona con datos, pero sin la naturaleza dinámica, accesible y adaptable del Software de Código Abierto (OSS, por sus siglas en inglés — Open Source Software), el ritmo de explotación de los campos ricos en datos sería dolorosamente lento. Imagine un mundo de ciencia de datos sin Linux, Python, Anaconda o Tensorflow, sólo por citar algunos ejemplos relevantes …

Predicciones con Incertidumbre en Modelos de Aprendizaje Profundo

Axel Brando Procesamiento de datos

En BBVA trabajamos desde hace tiempo para aprovechar los datos transaccionales de nuestros clientes y los modelos de Deep Learning para ofrecer una experiencia bancaria digital personalizada y relevante a nuestros clientes. Nuestra capacidad de prever los ingresos y gastos recurrentes en una cuenta es una de las más diferenciadoras de la industria. Este tipo de previsión ayuda a los …

¿Cómo será el Banco del Futuro?

Jairo Mejía Visión y Valores

No hace mucho tiempo, mucha gente todavía se presentaba en una oficina bancaria con un cheque de pago de su empleador, recogía el dinero y se iba con una nueva pila de facturas, que nunca se veía entre las columnas del gigantesco edificio hasta el siguiente día de pago. No vieron el caso de uso de una cuenta bancaria, ya …

La Equidad en Machine Learning se Vuelve “Mainstream”

Jairo Mejía Visión y Valores, Formas de trabajo

Las consideraciones de equidad o “fairness” en el desarrollo de soluciones basadas en Machine Learning (aprendizaje automático) están cobrando fuerza como aspecto clave de la inteligencia artificial y la modelación de comportamientos sociales. Esta semana, el Harvard Business Review publicó un artículo escrito por los responsables de un proyecto de análisis en sanidad que utiliza Machine Learning para detectar a …