Netflix: los algoritmos también fallan
José Soto Galindo
25 noviembre, 2016Entre las incorporaciones al léxico cotidiano, la palabra algoritmo tiene un lugar privilegiado. La economía digital, y sobre todo la llamada economía de plataformas con Uber, Facebook y Netflix como mejores ejemplos, está soportada sobre fórmulas matemáticas que recopilan datos de los consumidores para darles un tratamiento con fines de negocio y ofrecer nuevos servicios y funcionalidades. El mexicano Carlos Gómez Uribe es el responsable de algoritmos de Netflix y sus objetivos corporativos son básicamente dos: retener usuarios y ordenar los videos disponibles en la plataforma. Gómez Uribe tiene claro que estas fórmulas matemáticas, llamadas algoritmos, también se equivocan y pueden entregar resultados distintos a los esperados.
“Los algoritmos se equivocan por muchas razones, pero el punto principal es que cuando estás tomando miles de millones de decisiones diarias, lo que me queda claro es que la mejor manera de hacerlo es a través de algoritmos y computadoras”, dijo Gómez Uribe, vicepresidente de Innovación de Producto en Netflix, con 83.26 millones de suscriptores de paga en el mundo (alrededor de 3.8 millones en México, de acuerdo con The CIU). “Como nuestro catálogo es bastante extenso, ayudar a que en cada sesión cada persona fácilmente encuentre un buen video qué ver acaba siendo que el producto sea mucho más útil y por lo tanto el deseo de cancelar la suscripción disminuye”. De acuerdo con el directorio FlixList, que compila todos los contenidos disponibles en Netflix, el catálogo se compone de por lo menos 16,125 títulos en los 190 países en los que tiene operaciones. En México, el volumen ronda los 3,500 títulos.
El modelo de negocio de Netflix se compone de tres ejes principales: el contenido audiovisual (películas, series de televisión, documentales y standups producidos por la casa o por terceros); los algoritmos de recomendación, para incidir en las preferencias de consumo de los usuarios, y las herramientas de análisis de grandes volúmenes de información (big data), que le permite adelantarse a los gustos de los consumidores, producir nuevo contenido y crear productos de mercadotecnia. Los datos y metadatos recabados por Netflix de sus usuarios posibilitan realizar inferencias sobre hábitos de consumo, estados de ánimo o patrones de comportamiento.
Un ejercicio publicado en Economicón el 26 de octubre pasado, con base en una solicitud de acceso a datos personales conforme a la regulación mexicana, Netflix me entregó un expediente de 153 páginas con 2,485 líneas de información que, entre otras cosas, contenía un listado de los productos consumidos, las calificaciones que doy a los contenidos, los dispositivos utilizados para el consumo y las direcciones IP para la conexión. De acuerdo con la información, en 15 meses de servicio (la solicitud abarcó de julio del 2015 a septiembre del 2016) se consumieron desde mi cuenta 712 horas de contenido, distribuidas entre 866 productos audiovisuales, la mayoría series de televisión y películas. La reproducción de cada título costó 1.88 pesos.
De acuerdo con Gómez Uribe, 80% de la actividad de visualización en Netflix es conducida por algoritmos, ya sea desde las listas de tendencias, de sugerencias porque se reprodujeron títulos con contenido relacionado, de productos más populares o incluso desde los correos electrónicos enviados por Netflix a sus suscriptores. “Cuando creemos que un video nuevo te va a gustar, eso también se basa en un algoritmo de recomendación”, dijo este ingeniero y matemático con oficina en Los Gatos, California, y desde donde dirige un equipo de 80 personas, especializadas en ingeniería, estadística y ciencias.
El insumo más importante para Netflix del comportamiento de sus usuarios son las “vistas”, el registro que se crea cada vez que los consumidores reproducen un video, una colección de eventos relacionados que abarcan título, fecha y hora, dispositivo de consulta y tiempo de reproducción. “En Netflix sabemos cuáles recomendaciones damos que son acertadas o cuáles no, sabemos también cuál es la exacta, cuánto tiempo cada perfil ha disfrutado de un video y tomamos en cuenta esos datos para tratar de entender qué tanto lo han disfrutado”.
De acuerdo con Gómez Uribe, Netflix utiliza algoritmos para encontrar patrones de comportamiento, sin la intención de identificar individualmente a los usuarios por género o edad. En los laboratorios se crean asociaciones de perfiles con intereses similares, con la intención de entregarles recomendaciones que puedan causar interés. “Tenemos millones de agrupaciones que creamos cada día y cada día las destruimos y usamos los datos más recientes de reproducción de videos para crear nuevas agrupaciones”.
Netflix en números | |
---|---|
83.26 | 3.85 |
millones de suscriptores tiene Netflix en 190 países, al 30 de septiembre del 2016. | millones de usuarios tiene Netflix en México, de acuerdo con cálculos de The CIU. |
16,125 | 3,500 |
títulos forman el catálogo global de Netflix, según datos del directorio FlixList. | millones de usuarios tiene Netflix en México, de acuerdo con cálculos de The CIU. |
4,910 | 50,510 |
millones de dólares gastó Netflix en el 2015 en la producción de contenidos originales. | millones de dólares es el valor de capitalización de Netflix en el Nasdaq. |
Fuente: Netflix, The CIU, FlixList, Nasdaq, IHS Markit y Statista. |
El aviso de privacidad de Netflix, el contrato que la compañía firma con sus clientes para el uso de datos personales, señala que la firma sólo recaba el nombre completo, el correo electrónico y los datos de facturación de sus usuarios. Lo demás son metadatos —información vinculada a los datos personales y que fuera de contexto no aporta valor— construidos a partir de los eventos producidos en cada “vista” y por hábitos de navegación en la plataforma.
Netflix, dijo Gómez Uribe, no inyecta a sus herramientas de análisis datos personales compilados por otras fuentes, aunque su aviso de privacidad sí tiene prevista esa posibilidad en el capítulo “Recolección de la información”: “Podemos complementar la información descrita anteriormente con información obtenida de otras fuentes, incluida la de proveedores de datos obtenidos tanto online como sin conexión a Internet. Esta información complementaria puede incluir datos demográficos, datos basados en los intereses y conductas de navegación por Internet” (actualizado al 6 de enero del 2016). “En general, los datos que usamos son los datos que describen cómo interactúan nuestros miembros con el servicio, principalmente viendo qué son los videos que reproducen”, dijo Gómez Uribe.
De acuerdo con el aviso de privacidad, la información recopilada por Netflix sólo se utiliza para determinar la zona geográfica desde la que se consume el contenido; para ofrecer contenidos localizados y recomendaciones de títulos que podrían ser de interés de los consumidores; determinar al proveedor de los servicios de conexión a internet y las características del ancho de banda, y realizar servicios de comunicación entre Netflix y sus suscriptores. Y de acuerdo con Gómez Uribe, los algoritmos diseñados para procesar esa información recopilada sólo sirven para crear herramientas que ayuden a retener usuarios y ordenar el catálogo de videos.
Y aunque los algoritmos a veces fallan, principalmente por errores en los sistemas de cómputo, por la complejidad que significa acertar en el gusto individual de las personas o por un mal diseño de la fórmula matemática, la idea en Netflix es experimentar permanentemente. “Corremos cientos de experimentos al año, tratando de reducir la tasa de cancelación y aumentar el tiempo que pasan nuestros usuarios en Netflix, mediante mejoras algorítmicas. En general en los últimos años hemos encontrado entre 5 y 10 algoritmos que lo hacen bastante bien”, dijo.
Este artículo se publicó en El Economista el 24 de noviembre de 2016.