BBVA AI Factory | Los embeddings: una tecnología presente en nuestro día a día

Los embeddings son ampliamente utilizados en la personalización de servicios digitales. Esta tecnología transforma la información en representaciones numéricas que captan las similitudes y relaciones entre conceptos, agilizando el trabajo de los sistemas de IA.

¿Quién no se ha sorprendido alguna vez con las acertadas recomendaciones que le ha hecho su plataforma de música, de vídeo o de noticias favorita? ¿Cómo funcionan las recomendaciones de restaurantes en una aplicación de comida a domicilio? En estos y muchos otros casos, los embeddings de datos juegan un papel fundamental en conseguir que los contenidos se ajusten a nuestras preferencias.

Como ya esbozamos en un artículo anterior, los embeddings convierten información de diferente índole en una representación numérica. Esto nos permite encontrar similitudes o relaciones entre conceptos, de tal forma que elementos que consideremos parecidos, estarán representados cerca entre sí en el espacio de los embeddings.

Cómo funcionan los embeddings: un ejemplo gráfico

Para entender cómo funciona esta tecnología, imaginemos un enorme tablero de corcho en una habitación. Este tablero contiene imágenes de diferentes tipos: fotos de tus amigos, mapas de viajes que has hecho, postales de cuadros de algún museo que visitaste y carteles de películas que te gustan. Además, decides disponer estas imágenes de una determinada manera, agrupando elementos que pertenecen a la misma temática o tienen similitud entre ellos. En realidad, estás actuando como lo haría un embedding, capturando las relaciones entre elementos.

Un embedding concreto almacenará información de un dato en concreto, contextualizado con más datos con los que comparte propiedades en el mundo real. Como en el tablero, los datos que tengan similitudes o que estén relacionados estarán más cerca unos de otros.

A pesar de la tendencia a relacionarlos solo con texto, los embeddings tienen la capacidad de codificar información de distintas naturalezas. Como veremos a continuación, en nuestro día a día interactuamos constantemente con esta tecnología.

Un día a través de embeddings

Mañana Al informarte: buscando noticias en tu navegador	Te levantas, bostezas y tomas tu móvil. Con un café en mano, decides explorar las últimas noticias en tu navegador. Google, a través de la tecnología de embeddings de palabras, analiza tu búsqueda para captar el contexto y comprender lo que estás buscando de la forma más precisa posible.¹ Mediante este proceso tus palabras se transforman en vectores numéricos y se organizan en un espacio vectorial estructurado, donde palabras de significado similar o relacionado se encuentran próximas entre sí. Esta disposición permite al motor de búsqueda discernir el significado preciso de términos con múltiples interpretaciones. Por ejemplo, “jaguar” podría referirse al animal, la marca de coches o un equipo deportivo. Los embeddings ayudan a Google a determinar la acepción más pertinente para ti, basándose en el contexto completo de tu búsqueda y tus interacciones previas. Esta tecnología también hace que Google sea capaz de procesar y entender consultas formuladas de manera natural, acercando la interacción con el motor de búsqueda a una conversación real. Así, al preguntar “¿Qué pasó en el mundo hoy?”, Google interpreta eficazmente tu consulta abierta, ofreciéndote un resumen de las noticias más relevantes del día, demostrando una comprensión profunda del contexto actual y la relevancia de la información para ti.
Te pones en marcha: música para tus oídos con Spotify	Sales de casa y eliges Spotify para escuchar música, donde se te sugiere una lista de reproducción personalizada que se alinea con tu estado de ánimo y tu gusto musical. Esta experiencia a medida se logra a través de CoSeRNN², una arquitectura de red neuronal que analiza patrones de escucha y variables contextuales para prever qué música resonará contigo. Este modelo convierte tus interacciones con la plataforma en una secuencia de embeddings, generando recomendaciones precisas y contextuales, transformando cada sesión de escucha en una experiencia personalizada. Por otro lado, Spotify utiliza el conocido modelo word2vec para generar la representación latente de las canciones, permitiendo medir similitudes entre pistas. Así es como Spotify es capaz de generar recomendaciones personalizadas: captura las características de las canciones que se reproducen en una sesión de escucha y estructura toda esta información. A la hora de ofrecer la recomendación, tiene en cuenta este histórico de sesiones, pero también el contexto presente, como la hora del día y el dispositivo que utilizas. Las recomendaciones pueden encontrarse en las listas de reproducción que Spotify crea especialmente para ti, las cuales además de reflejar tus gustos te invitan a explorar nuevos géneros y artistas, enriqueciendo tu repertorio musical.
Tarde Al llegar a casa: asistentes virtuales con IA	Cuando llegas a casa, le pides a tu asistente virtual que te recuerde una reunión importante. Detrás de esta interacción aparentemente simple, los embeddings están trabajando arduamente. Estos asistentes inteligentes, como lo es Alexa, utilizan embeddings de palabras para entender tus preguntas (decodificar tu comando, procesamiento de lenguaje) y para responderte (codificar un mensaje, generación de lenguaje) de forma natural. Con el objetivo de evolucionar el servicio de comprensión de lenguaje natural (NLU), Alexa utiliza embeddings que condensan el contexto de los diálogos o interacciones pasadas³, del dispositivo utilizado e incluso de preferencias del usuario. Esto permite que el asistente interprete con precisión tus intenciones, incluso si tu forma de expresarte varía. Por ejemplo, “¿Mañana tengo el día libre?” y “¿Me recuerdas qué tengo que hacer mañana?” pueden parecer diferentes, pero conducen al mismo tipo de respuesta: conocer tu agenda de mañana.
Sin tiempo para preparar la cena: pidiendo comida a domicilio	Al abrir tu aplicación de comida a domicilio favorita, notas cómo de forma casi instantánea aparece ante ti una selección de restaurantes recomendados. Esta selección será diferente a la que pueda tener una amiga que vive en otra ciudad y además sigue una dieta vegetariana. Uber Eats podría ofrecerte millones de opciones; pero, si su modelo de machine learning predijese cuáles son los mejores restaurantes para ti en tiempo real, probablemente tardaría tanto que se te quitaría el hambre antes de obtener una respuesta. Afortunadamente, los embeddings entran en escena para acelerar este proceso. Los embeddings se utilizan en dos frentes⁴: por un lado, para obtener representaciones numéricas de los usuarios, capturando sus preferencias, ubicaciones y perfil de cliente. Por otro, para obtener vectores que representan información sobre los restaurantes, incluyendo el detalle sobre sus menús, ubicación, precios y demás información general. Esta doble capa de embeddings facilita una búsqueda rápida y eficaz, emparejando usuarios con sus opciones ideales de restaurantes.
Noche Llega el momento de relajarse: Netflix and chill	Te relajas en el sofá y acabas el día entrando en Netflix para empezar a ver una nueva serie. Al entrar, te sorprendes de la cantidad de nuevas series que Netflix está produciendo, ¿cómo es posible que todas tengan tanto éxito? Los creadores de Netflix quieren que sus nuevas producciones tengan los títulos más llamativos. Tradicionalmente, esto conlleva la investigación de títulos de otras producciones en el pasado y las audiencias que éstos alcanzaron. Puesto que cada vez hay mayor histórico de títulos en diferentes géneros, es diferencial el uso que hace Netflix de modelos de machine learning para optimizar e innovar con los nuevos títulos⁵. Aquí los embeddings también entran en juego.

Un día a través de embeddings

Mañana

Al informarte: buscando noticias en tu navegador

Te levantas, bostezas y tomas tu móvil. Con un café en mano, decides explorar las últimas noticias en tu navegador. Google, a través de la tecnología de embeddings de palabras, analiza tu búsqueda para captar el contexto y comprender lo que estás buscando de la forma más precisa posible.¹.

Mediante este proceso tus palabras se transforman en vectores numéricos y se organizan en un espacio vectorial estructurado, donde palabras de significado similar o relacionado se encuentran próximas entre sí. Esta disposición permite al motor de búsqueda discernir el significado preciso de términos con múltiples interpretaciones.

Por ejemplo, “jaguar” podría referirse al animal, la marca de coches o un equipo deportivo. Los embeddings ayudan a Google a determinar la acepción más pertinente para ti, basándose en el contexto completo de tu búsqueda y tus interacciones previas.

Esta tecnología también hace que Google sea capaz de procesar y entender consultas formuladas de manera natural, acercando la interacción con el motor de búsqueda a una conversación real. Así, al preguntar “¿Qué pasó en el mundo hoy?”, Google interpreta eficazmente tu consulta abierta, ofreciéndote un resumen de las noticias más relevantes del día, demostrando una comprensión profunda del contexto actual y la relevancia de la información para ti.

Te pones en marcha: música para tus oídos con Spotify

Sales de casa y eliges Spotify para escuchar música, donde se te sugiere una lista de reproducción personalizada que se alinea con tu estado de ánimo y tu gusto musical. Esta experiencia a medida se logra a través de CoSeRNN², una arquitectura de red neuronal que analiza patrones de escucha y variables contextuales para prever qué música resonará contigo. Este modelo convierte tus interacciones con la plataforma en una secuencia de embeddings, generando recomendaciones precisas y contextuales, transformando cada sesión de escucha en una experiencia personalizada.

Por otro lado, Spotify utiliza el conocido modelo word2vec para generar la representación latente de las canciones, permitiendo medir similitudes entre pistas.

Así es como Spotify es capaz de generar recomendaciones personalizadas: captura las características de las canciones que se reproducen en una sesión de escucha y estructura toda esta información. A la hora de ofrecer la recomendación, tiene en cuenta este histórico de sesiones, pero también el contexto presente, como la hora del día y el dispositivo que utilizas.

Las recomendaciones pueden encontrarse en las listas de reproducción que Spotify crea especialmente para ti, las cuales además de reflejar tus gustos te invitan a explorar nuevos géneros y artistas, enriqueciendo tu repertorio musical.

Tarde

Al llegar a casa: asistentes virtuales con IA

Cuando llegas a casa, le pides a tu asistente virtual que te recuerde una reunión importante. Detrás de esta interacción aparentemente simple, los embeddings están trabajando arduamente. Estos asistentes inteligentes, como lo es Alexa, utilizan embeddings de palabras para entender tus preguntas (decodificar tu comando, procesamiento de lenguaje) y para responderte (codificar un mensaje, generación de lenguaje) de forma natural.

Con el objetivo de evolucionar el servicio de comprensión de lenguaje natural (NLU), Alexa utiliza embeddings que condensan el contexto de los diálogos o interacciones pasadas³, del dispositivo utilizado e incluso de preferencias del usuario. Esto permite que el asistente interprete con precisión tus intenciones, incluso si tu forma de expresarte varía. Por ejemplo, “¿Mañana tengo el día libre?” y “¿Me recuerdas qué tengo que hacer mañana?” pueden parecer diferentes, pero conducen al mismo tipo de respuesta: conocer tu agenda de mañana.

Sin tiempo para preparar la cena: pidiendo comida a domicilio

Al abrir tu aplicación de comida a domicilio favorita, notas cómo de forma casi instantánea aparece ante ti una selección de restaurantes recomendados. Esta selección será diferente a la que pueda tener una amiga que vive en otra ciudad y además sigue una dieta vegetariana.

Uber Eats podría ofrecerte millones de opciones; pero, si su modelo de machine learning predijese cuáles son los mejores restaurantes para ti en tiempo real, probablemente tardaría tanto que se te quitaría el hambre antes de obtener una respuesta. Afortunadamente, los embeddings entran en escena para acelerar este proceso.

Los embeddings se utilizan en dos frentes⁴: por un lado, para obtener representaciones numéricas de los usuarios, capturando sus preferencias, ubicaciones y perfil de cliente. Por otro, para obtener vectores que representan información sobre los restaurantes, incluyendo el detalle sobre sus menús, ubicación, precios y demás información general. Esta doble capa de embeddings facilita una búsqueda rápida y eficaz, emparejando usuarios con sus opciones ideales de restaurantes.

Noche

Llega el momento de relajarse: Netflix and chill

Te relajas en el sofá y acabas el día entrando en Netflix para empezar a ver una nueva serie. Al entrar, te sorprendes de la cantidad de nuevas series que Netflix está produciendo, ¿cómo es posible que todas tengan tanto éxito?

Los creadores de Netflix quieren que sus nuevas producciones tengan los títulos más llamativos. Tradicionalmente, esto conlleva la investigación de títulos de otras producciones en el pasado y las audiencias que éstos alcanzaron. Puesto que cada vez hay mayor histórico de títulos en diferentes géneros, es diferencial el uso que hace Netflix de modelos de machine learning para optimizar e innovar con los nuevos títulos⁵. Aquí los embeddings también entran en juego.

Conclusiones

La tecnología de embeddings traduce nuestras acciones y comportamientos en un lenguaje comprensible para las máquinas, facilitando una interacción humano-máquina más intuitiva.

En el sector bancario, esto se puede traducir en una experiencia de usuario revolucionaria, donde cada interacción con la app no solo es comprendida sino también utilizada para mejorar la operativa y la experiencia global del cliente. Los embeddings encapsulan la complejidad de nuestras acciones en vectores numéricos. Esta particularidad resulta clave a la hora de personalizar los servicios y ofrecer productos que se adaptan a cada cliente.

Los embeddings: una tecnología presente en nuestro día a día

Cómo funcionan los embeddings: un ejemplo gráfico

Un día a través de embeddings

Al informarte: buscando noticias en tu navegador

Te pones en marcha: música para tus oídos con Spotify

Al llegar a casa: asistentes virtuales con IA

Sin tiempo para preparar la cena: pidiendo comida a domicilio

Llega el momento de relajarse: Netflix and chill

Un día a través de embeddings

Al informarte: buscando noticias en tu navegador

Te pones en marcha: música para tus oídos con Spotify

Al llegar a casa: asistentes virtuales con IA

Sin tiempo para preparar la cena: pidiendo comida a domicilio

Llega el momento de relajarse: Netflix and chill

Conclusiones

Notas

Referencias

Autores

Edición

Diseño