Los sistemas de recomendación consisten en un conjunto de técnicas y herramientas de software cuyo propósito es asistir a un usuario durante un proceso de toma de decisiones, recomendándole ítems que podrían ser de su interés. Estos sistemas surgieron porque Internet permitió mostrar a los usuarios un abanico cada vez mayor de alternativas para seleccionar entre sus preferencias y el ejemplo concreto de obtener buenas recomendaciones se ha convertido en un componente crítico dentro del proceso de toma de decisiones (uno de los primeros sistemas más populares ha sido el de Amazon, compañía de comercio electrónico fundada en 1994).

De hecho, el problema de hacer recomendaciones puede ser pensado como un aprendizaje de preferencias. “Los sistemas de recomendación realizan sus recomendaciones utilizando modelos predictivos de las preferencias que los usuarios tienen sobre los ítems. Dichas preferencias son inducidas a partir de la información del usuario, de los ítems y de las interacciones entre los usuarios y el sistema”, puntualiza el doctor Roberto Abalde, profesor de la Maestría en Data Mining de la Universidad de Buenos Aires y experto en inteligencia de negocios.

Este especialista hace una distinción importante entre sistemas basados en contenido y sistemas basados en conocimiento. “Los sistemas de recomendación basados en contenido realizan recomendaciones utilizando tanto las características del usuario como de los ítems que le han interesado al usuario. Por ejemplo cuando un usuario ha dado una buena calificación a las películas `Blade Runner` y `Star Wars` se podría inferir que tiene preferencia por las películas de ciencia ficción”.  En tanto que los sistemas basados en conocimiento,  “consideran el conocimiento explícito sobre los ítems a recomendar, las preferencias del usuario y los criterios de recomendación, es decir, qué elemento debe recomendarse en qué contexto. Por ejemplo, en un sistema de recomendación de eventos, se podría poner una regla como `si está lloviendo, entonces recomendar ir al cine`”, detalla Abalde. Cabe recalcar que los sistemas basados en conocimiento se aplican cuando no se puede recurrir a enfoques alternativos como el filtrado colaborativo y el filtrado basado en el contenido.

Una plataforma que debe su éxito a los algoritmos

Fuente: redwoodalgorithms.com

Netflix es una empresa estadounidense de entretenimiento cuyo modelo de negocios se basa en el streaming de video, multimedia y productos bajo demanda. Tiene más de 110 millones de suscriptores en más de 190 países, y cada uno de ellos recibe una experiencia diferente cada vez que inicia sesión.

Con el propósito de generar recomendaciones eficientes, utiliza complejos algoritmos de aprendizaje automático (machine learning) que toman en cuenta más de 100 factores y le sugieren al usuario el contenido que le gustaría ver. La primera capa del sistema de recomendaciones de la plataforma analiza qué es lo que ha visto un espectador, el orden y las fechas de reproducción, los programas que ha abandonado sin terminar o los que ha marcado como favoritos, entre otros datos similares. En segundo lugar, esta información de uso se combina con otros parámetros que ayudan a comprender mejor el contenido de los programas. Para ello personal interno o externo de la plataforma visualiza minuto a minuto todos los contenidos y los etiqueta de manera pormenorizada.

El contenido se clasifica en 150 categorías creadas para que el algoritmo funcione mejor y pueda recomendar más precisamente los contenidos (en efecto un 80% de los contenidos pueden ser visualizados y hallados gracias a esta herramienta). El “etiquetador” toma el material, lo ve y a partir de eso llena 150 criterios clave para identificar ese título. En House of Cards, por ejemplo, algunas de las categorías y etiquetas son: tono (oscuro, cínico, satírico), trama (política, corrupción, traición), violencia (3, moderada).

De este modo, la búsqueda está personalizada en Netflix, con los resultados influenciados por el tipo de cosas que un usuario ha visto y la popularidad de un título en particular.

Para conocer en detalle a su audiencia y mejorar la experiencia del usuario, habitualmente Netflix ejecuta por año cientos de pruebas de productos nuevos con sus espectadores. En declaraciones a la prensa, el vicepresidente de innovación de productos de Netflix, Chris Jaffe, explicó que la plataforma selecciona a 300 mil usuarios de todo el mundo para un A/B Testing, donde se testea desde la percepción de las imágenes hasta el tamaño de la fuente en la pantalla. Por ejemplo, probaron nuevos trailers de video de reproducción automática cuando un usuario pasa sobre un título; si la imagen que aparece en la parte superior de la pantalla cuando desplaza el mouse sobre un título debe ser estática o un carrusel o si las sinopsis detalladas harían que los usuarios tuvieran más probabilidades de ver un título.

En los últimos años las implementaciones de sistemas de recomendación se han expandido en tal medida que ya forman parte de la vida de mucha gente, por ejemplo en Netflix o Spotify”,  comenta Abalde.  Y aclara “actualmente se está investigando la mejora del desempeño de las técnicas usadas para predecir las preferencias del usuario, por ejemplo usando técnicas de aprendizaje profundo”.

A Kevin Spacey lo salvó Big Data

Cuando el actor Kevin Spacey presentó el proyecto de un thriller político en la Casa Blanca fue rechazado por varias productoras de televisión. En cambio, Netflix apostó por la idea y la serie House of Cards resultó un éxito. Utilizó el enorme volumen de datos de sus millones de suscriptores, que almacena en tiempo real, y predijo lo que la gente podría querer ver.

El caso de House of Cards es muy interesante ya que usaron la base de datos de las preferencias expresadas de sus usuarios para hacer una ‘recomendación inversa’: le recomendaron usuarios a una serie”, señala Roberto Abalde. Según el profesor de la Maestría en Data Mining, trataron de predecir la audiencia de una serie que no existía anteriormente preguntando “¿Si la serie es política y oscura, quién la vería?” o “¿Si la protagoniza Kevin Spacey, quién estaría interesado?”.

En este sentido, Abalde reconoce que sería potencialmente valioso hacer una investigación o una tesis para detectar si se pueden aplicar las recomendaciones inversas en otros ámbitos. “Por ejemplo, en un sistema de educación en línea se podría preguntar `Si desarrollamos este video sobre matemáticas ¿a qué alumnos ayudaría a aprender?’”,  reflexiona.

El valor de los sistemas de recomendación y la investigación por fuera del ámbito comercial

La investigación actual en sistemas de recomendación se realiza en varias líneas. Por un lado, se investiga la mejora del desempeño de las técnicas implementadas para predecir las preferencias del usuario, por ejemplo, usando técnicas de aprendizaje profundo. Otra línea es ver la posibilidad de implementar sistemas de recomendación en nuevos ámbitos, por ejemplo las recomendaciones para grupos de personas o en la educación en línea o el gobierno. Y una tercera línea consiste en investigar cómo solucionar problemas que pueden traer los sistemas de recomendación, por ejemplo, ver si las recomendaciones tienen sesgos (recomendarle a las mujeres trabajos como asistentes mientras que a los hombres trabajos gerenciales).

De acuerdo con lo que plantea Abalde “si bien mucha de la investigación y las implementaciones de sistemas de recomendación suelen ser dentro de las empresas, se están desarrollando en otros ámbitos, por ejemplo en la salud [1], en las citas en línea [2], en educación [3], en ingeniería de software [4], en el gobierno [5] y en ciencia [6]. De hecho, gran parte de la investigación actual se enfoca en nuevos ámbitos de implementación de sistemas de recomendación”.

___________________________________________________

Referencias

[1] WIESNER, Martin; PFEIFER, Daniel. Health recommender systems: concepts, requirements, technical basics and challenges. International journal of environmental research and public health, 2014, vol. 11, no 3, p. 2580-2607.

[2] ANDREWS, Eric, et al. Recommender Systems for Online Dating. 2015.

[3] KARYPIS, George. Improving Higher Education: Learning Analytics & Recommender Systems Research. En Proceedings of the Eleventh ACM Conference on Recommender Systems. ACM, 2017. p. 2-2.

[4] FELFERNIG, Alexander, et al. Or: Recommender systems in requirements engineering. 2017.

[5] YANG, Jie, et al. CitRec 2017: International Workshop on Recommender Systems for Citizens. En Proceedings of the Eleventh ACM Conference on Recommender Systems. ACM, 2017. p. 388-389.

[6] BEEL, Joeran, et al. paper recommender systems: a literature survey. International Journal on Digital Libraries, 2016, vol. 17, no 4, p. 305-338.

 

Este Post fue originalmente publicado en: http://datamining.dc.uba.ar/predictivos