“Entender que el comportamiento no solo depende de las características personales de un individuo, sino que también influye el contexto”
David Gallardo-Pujol es psicólogo y doctor en Psicología. Su experiencia investigadora gira alrededor de la predicción del comportamiento, el análisis de la interacción entre individuos y contexto, y la evaluación psicológica. Actualmente es catedrático de Personalidad en la Universidad de Barcelona, donde también ejerce como director del máster Behavioral Data Science.
¿Qué son los datos conductuales? ¿Hay diferencia respecto a los datos tradicionales?
Para mí no hay diferencia entre un dato y un dato comportamental. Un dato es una pieza de información y un dato comportamental es una pieza de información referida al comportamiento. Prácticamente todo lo que podemos observar, registrar o preguntar, siempre que intervenga una persona, puede ser considerado un dato comportamental. Esta definición, lejos de ser restrictiva, es amplia y versátil, ofreciendo numerosas posibilidades de análisis e interpretación en una variedad de contextos.
Para mí no hay diferencia entre un dato y un dato comportamental. Un dato es una pieza de información y un dato comportamental es una pieza de información referida al comportamiento. Prácticamente todo lo que podemos observar, registrar o preguntar, siempre que intervenga una persona, puede ser considerado un dato comportamental.
Entonces, ¿todos los datos de personas se pueden considerar comportamentales?
Sí. Uno de los principales desafíos que enfrentan las Ciencias del Comportamiento, especialmente la Psicología, está relacionado con la capacidad computacional, es decir, cuántos datos podemos analizar simultáneamente. Es ahora cuando estamos observando que existen muchos elementos que inicialmente no pensábamos que podrían estar relacionados con aspectos del comportamiento pero que son indicadores de la conducta. Por supuesto que los factores psicográficos, es decir, las características psicológicas y de comportamiento de las personas, como la personalidad, las capacidades, las actitudes y los valores, siempre están presentes y, aunque no determinan directamente un comportamiento específico, sí nos proporcionan ciertos márgenes de respuesta, además de unos rangos dentro de los cuáles se manifiesta nuestro libre albedrío, dependiendo de la situación. Estos aspectos condicionan todas y cada una de las decisiones que tomamos a lo largo de nuestra vida.
Pero ¿podríamos obtener un dato comportamental incluso de los datos demográficos como el sexo o la edad?
Sí, aunque la respuesta no está exenta de polémica. Se pueden hacer predicciones brutas a partir del sexo o de la edad. Por ejemplo, la investigación empírica sugiere que la responsabilidad tiende a aumentar con la edad. Del mismo modo, se podría inferir que una persona que se identifica como mujer podría ser más sensible emocionalmente que una persona que se identifica como hombre. Sin embargo, estas predicciones basadas en grandes categorías demográficas tienen limitaciones. Aunque ofrecen una visión general, no capturan la complejidad individual. Para superar estas limitaciones, es necesario personalizar la información utilizando, por ejemplo, psicográficos.
Las predicciones basadas en grandes categorías demográficas tienen limitaciones. Aunque ofrecen una visión general, no capturan la complejidad individual. Para superar estas limitaciones, es necesario personalizar la información utilizando, por ejemplo, psicográficos.
¿Y este es el rol del Behavioral Data Scientist?
Entre otros. Un Behavioral Data Scientist, en la empresa, tiene que servir de enlace entre los científicos de datos o la gente de Analytics y todos aquellos departamentos que tengan que tomar decisiones respecto a personas: estrategia, marketing o el propio CEO. Pero es necesario que haya una persona que entienda el lenguaje de todas las áreas.
Predecir el comportamiento es uno de los objetivos como científicos de datos comportamentales. ¿Cuál es el proceso para llevar a cabo estas predicciones?
Es necesario tener en cuenta que predecir el comportamiento es extremadamente difícil. De hecho, es uno de los desafíos científicos y tecnológicos más importantes de este siglo XXI. Y es que ya a finales del siglo pasado se decía que había dos grandes fronteras en la ciencia: el mundo exterior y entender cómo funciona el universo, además del mundo interior, es decir, entender cómo funciona el cerebro. De todas formas, a la hora de predecir la conducta hacen falta varios elementos. En primer lugar, es necesario entender que el comportamiento no solo depende de las características personales de un individuo, sino que también influye el contexto. En segundo lugar, es necesario tener buenas medidas de ambos. En cuanto a los aspectos personales, los científicos del comportamiento y los psicólogos han logrado avances significativos en este campo a lo largo de los últimos 100 años. Pero también es necesario tener datos del contexto, y es algo que hemos empezado a hacer de manera efectiva a principios del siglo XXI, con el surgimiento de los entornos digitales. Por ejemplo, ahora llevamos con nosotros un sensor que es nuestro teléfono o smartwatch. Es en este momento cuando estamos comenzando a tener acceso a medidas precisas tanto de las características individuales como del contexto.
Predecir el comportamiento es extremadamente difícil. De hecho, es uno de los desafíos científicos y tecnológicos más importantes de este siglo XXI.
¿Existen estudios en los que recopilan datos del contexto?
Sí. Existen varios estudios en los que los móviles de los participantes de activan a intervalos aleatorios y graban conversaciones. En otros experimentos controlados, algunas personas llevan cámaras colgadas que capturan imágenes de la situación, sin enfocar específicamente a la persona. Esto nos brinda datos adicionales sobre el contexto que antes nos faltaban. Además, aquí interviene otro tercer elemento, que es la existencia de buenos modelos causales, es decir, de predicción. Eso sí; hay quien decide predecir “a lo loco”, introduciendo todo en un modelo, sin importar ni el cómo ni el porqué, pero al final, se logra hacer alguna predicción certera e inevitablemente, también se generan predicciones espurias. Desde mi punto de vista, las predicciones no deberían hacerse al azar, sino que debe haber un modelo causal y explicativo de por qué suceden determinados fenómenos. Y aquí el rol del Behavioral Data Scientist es clave.
¿Es posible inferir los rasgos de la personalidad a partir de sus datos conductuales sin usar tests explícitos como el OCEAN? Por la dificultad que entraña, a nivel empresarial, lograr que sus clientes o potenciales clientes los cumplimenten, además de porque son datos sensibles…
El test OCEAN, también conocido como el modelo de los Cinco Grandes, es una herramienta ampliamente utilizada en Psicología para evaluar la personalidad. Este modelo se basa en cinco dimensiones principales: apertura a la experiencia (openness), responsabilidad (conscientiousness), extraversión (extraversion), amabilidad (agreeableness) y estabilidad emocional (neuroticism). Estas dimensiones proporcionan una estructura para comprender y medir varios aspectos de la personalidad de un individuo. La OCDE utiliza este tipo de modelos para evaluar y medir competencias en adultos, incluyendo las competencias socioemocionales. Sin embargo, este tema es extremadamente complejo, ya que este tipo de información está clasificada como datos personales sensibles de primer nivel, como los datos de salud, que deben ser protegidos. De hecho, cuando llevamos a cabo investigaciones o los utilizamos, los Comités de Bioética nos instan a tener un nivel de seguridad muy alto para prevenir el robo de estos datos o su mal uso, ya que pueden permitir la reconstrucción de la identidad de una persona. Dicho esto, es clave tener un cuidado ético extremo en todo momento. Son muchas las empresas que ya utilizan estas técnicas sin mencionarlo explícitamente. Cuando leemos los términos y condiciones de numerosos sitios web o aplicaciones, es común que una cláusula indique que nuestros datos serán utilizados para elaborar recomendaciones o modelos de predicción de nuestro comportamiento, entre otras cosas. Y están reconstruyendo nuestros perfiles de personalidad, aunque no lo digan explícitamente. Por eso es fundamental que este proceso se realice de manera ética y transparente, con el mismo cuidado que se pone en la protección de los datos de salud porque las aplicaciones en este ámbito están estrictamente reguladas, pero el resto no reciben la misma atención desde el punto de vista regulatorio.
¿Existen estudios sobre dichas reconstrucciones?
Sí. Algunos estudios han demostrado que aspectos como la orientación sexual puede reconstruirse a partir de rastros digitales, como por ejemplo, nuestras fotos de perfil. También están los trabajos de Clemens Stachl. Uno de los más recientes analizaba datos recopilados a través del uso del móvil durante un periodo de 15 días o 3 semanas. Utilizando estos datos, reconstruyeron con un alto grado de precisión los perfiles de personalidad de los participantes, no solo en cuanto a los cinco grandes rasgos, sino también en lo que respecta a las facetas más específicas. Este es un tema extremadamente delicado, especialmente si recordamos el escándalo de Cambridge Analytica, donde se llevó a cabo un proceso similar sin el consentimiento adecuado. Aunque es éticamente condenable, desde el punto de vista científico, la idea fue brillante y tuvo un impacto significativo, como lo evidenció el resultado del referéndum del Brexit y la elección de Trump. Inevitablemente tiene que llevarnos a reflexionar sobre la importancia de informar claramente a las personas sobre cómo se utilizarán sus datos, especialmente en lo que respecta a la reconstrucción de su personalidad. Por eso, creo que es fundamental comunicar de manera explícita a los usuarios que sus datos serán utilizados para mejorar su experiencia de usuario, y no con fines maliciosos. Muchas empresas no buscan manipular a las personas, sino ofrecer un servicio personalizado y mejorar la calidad de su producto.
También existen estudios en los que se busca predecir el riesgo crediticio vinculado al riesgo moral o de personalidad. ¿Es posible inferirlo sin llevar a cabo un test de personalidad?
Sí. Por ejemplo, a partir de si tienes algún recibo impagado o si has tenido algún día en descubierto en tu cuenta. También en muchas ocasiones te preguntan qué tipo de trabajo tienes, si es estable o eventual y te piden la nómina. Estas variables también son datos conductuales porque son indicadores de los rasgos de personalidad. En el caso de los seguros de automóviles, hay estudios antiguos que indican que si tienes un coche negro o de un color muy llamativo, especialmente si es deportivo, puede apuntar a que tienes una mayor búsqueda de sensaciones, y por tanto, una mayor tendencia al riesgo. Y se podría aplicar esto a la prima, incrementándola. Estas variables, aunque no miden directamente la tendencia al riesgo, lo infieren a partir de estas variables, que son “proxies” o indicadores indirectos.
¿Y es posible saber si puntúas alto en apertura a la experiencia sin realizar el test OCEAN?
Se podría inferir, por ejemplo, a partir del uso que hagas de Spotify. Cada una de las canciones de la plataforma tiene asignado uno o varios géneros concreto. Por lo que, cuanta más variedad de estilos musicales escuches en un período de tiempo determinado, podría indicar una mayor apertura a la experiencia.
En este sentido, Cambridge Analítica, en la campaña de Trump, habría mostrado mensajes políticos personalizados en función de la cordialidad.
Sí. En la campaña de Trump, se utilizaron con anuncios de Google Ads. Se transmitía el mensaje de que, si no se votaba por el Partido Republicano, los Demócratas permitirían una mayor inmigración ilegal, lo que, según se sugería, afectaría la disponibilidad de plazas en guarderías para los hijos de los votantes. Este enfoque era sutil pero sugestivo. Por otro lado, si se apuntaba a una audiencia con bajos niveles de cordialidad y alta hostilidad, el mensaje era más directo y contundente: advertía que, si los Demócratas ganaban, eliminarían la Segunda Enmienda de la Constitución de los Estados Unidos, que protege el derecho a poseer armas de fuego.
¿Cómo sabían cuánto puntuaban en cordialidad estas personas?
Reconstruyeron la personalidad de todas estos individuos, a partir del uso de datos recogidos en Facebook, de forma ilícita. Esto incluía el número de «me gusta» y los tipos de publicaciones a las que reaccionaban, así como el tiempo que dedicaban a leer cada publicación. Además, llevaron a cabo un procesamiento de lenguaje natural para analizar el contenido de las publicaciones. Por ejemplo, descubrieron que las personas tienden a pasar más tiempo leyendo artículos que se alinean con su personalidad. Y aquellos individuos más cordiales prefieren contenidos neutrales, mientras que aquellos con puntuaciones más bajas en esta variable prefieren titulares impactantes. Eso sí; toda esta información fue procesada de manera ilícita.
¿Cómo ves el futuro en este campo?
Prometedor. Por ejemplo, en la Universidad de Barcelona estamos investigando si al utilizar grandes corpus de texto y modelos de lenguaje avanzados, es posible inferir la personalidad de los individuos. La investigación previa sugiere que esto es muy factible. Además, como ya tenemos capacidad computacional de sobra, se podría probar a sintetizar la personalidad para crear robots o avatares virtuales que tengan rasgos de personalidad congruentes con los de las personas por lo que la comunicación sería mucho más efectiva. Y esto tiene aplicaciones, por ejemplo, en robótica asistencial, es decir, se podría intentar lograr que una persona mayor no solo recuerde tomar una pastilla en un día específico, sino que efectivamente la tome. El robot podría estar presente para persuadirlo, adaptando su personalidad para que sea congruente con la del individuo.
Ahora, el Santo Grial parece ser la segmentación conductual. Pasar de la segmentación de datos demográficos a los psicográficos… ¿Cómo se logra llevar a cabo este cambio?
Hasta ahora, las estrategias han incluido la reconstrucción de datos psicográficos a partir de las redes sociales, pero esto tiene sus límites y se espera que sea más difícil con la imposición de regulaciones más estrictas. Otra estrategia implica el análisis de entrevistas en video, imágenes y lenguaje natural. Sin embargo, para lograr una microsegmentación efectiva, se requiere tanto una fuente confiable de información como un método de entrega personalizado, como a través de redes sociales o teléfonos móviles. Además, se necesita un modelo confiable para reconstruir la personalidad psicográfica y un canal adecuado para entregar el mensaje de manera personalizada. En cuanto al desarrollo futuro en los próximos cinco años, se espera una mejora en la precisión y refinamiento de los modelos psicográficos, así como un enfoque en intervenciones personalizadas para provocar cambios de comportamiento. Esto podría representar una verdadera revolución en la forma en que se utilizan las estrategias de nudging, lo que se espera que se empiece a ver en los próximos años.