¿Qué son las Pruebas A/B?

En la campaña presidencial de Barack Obama en 2008, el equipo interno estaba teniendo dificultad en convertir las visitas a su sitio web en suscripciones. Aplicaron prácticas de marketing comercial y cambiaron su sitio. Probaron tres mensajes diferentes para sustituir el botón 'Suscríbete': 'Aprende más", 'Únete ahora' y 'Suscríbete ahora'. Descubrieron que 'Aprende más' atrajo en mayor grado (+18.6%) a personas visitantes. Cuando combinaron esta consigna con seis opciones diferentes de fotos y videos, aumentaron las suscripciones en un 3%. Aunque puede parecer poco avance, la campaña estimó que este cambio significó casi 3 millones de suscripciones y $60 millones USD de nuevas donaciones. Cuatro años más tarde, en la campaña de re-elección de Obama, se hicieron 500 pruebas A/B en el sitio web y a través de correo a lo largo de 20 meses, pruebas parecidas a la descrita anteriormente. Incrementaron las donaciones en un 29% y las suscripciones en un 161%.

Las pruebas A/B, a veces denominadas 'split testing', comparan dos o más variables de un anuncio o mensaje para determinar cuál funciona mejor. Las campañas suelen experimentar con sus páginas de donativos para aumentar las contribuciones. En 2016, la campaña presidencial estadounidense de Ben Carson quiso probar qué recaudaba más donaciones: ¿un libro o una gorra? Aleatoriamente redireccionaban las visitas web a una página de donativos que regalaba una gorra o un libro. Si la gorra generaba más interés, la campaña podría realizar otro experimento comparando 'una gorra' versus 'una bolsa' y así seguir optimizando su sitio web.

5_19-us-state-voter-list

Artículo publicado en medium.com donde se explora cómo la campaña presidencial de Ben Carson en 2016 realizó pruebas para averiguar si era más eficaz regalar un libro o un gorro para recaudar donativos. Esta prueba se realizó en su sitio web (inactivo cuando se escribió el artículo) BenCarson.com
Fuente: Medium, accessed 11 March 2019.

Aunque las pruebas A/B son comunes hoy en día en la tecnología y en las campañas, este método se remonta a los años 1920s: el estadístico británico Ronald Fisher formalizó las bases matemáticas de las pruebas A/B experimentando con el crecimiento de cosechas agrícolas: aplicaba fertilizante a algunos terrenos y otros no para comparar el efecto. Desde entonces, las pruebas A/B se han integrado en la esfera política. Forman parte de las prácticas estándar de campañas aplicadas a sitios web, correos (asunto de correo, mensajes), diseño (imágenes, fondos, botones), titulares, publicidad , televisión, radio, contacto telefónico y hasta mensajes de texto SMS. Muchos servicios facilitan la aplicación de las pruebas A/B en campañas políticas, brindando funcionalidades para probar diferentes cambios simultáneamente.

¿Cómo utilizan mis datos?

La creación y evaluación de las pruebas A/B dependen de datos personales. En primer lugar, usan datos personales para seleccionar a quiénes se les va a realizar la prueba. Si una campaña quisiera movilizar a madres trabajadoras en un distrito o barrio donde a veces votan a un partido y a veces a otro o quisiera promover la participación en una actividad política, por ejemplo, podría dirigir las pruebas a ciertas personas según dónde viven, información que se puede obtener a partir de ficheros de votantes, intercambio de datos u otras fuentes. Siempre y cuando la campaña tenga los datos relevantes, suficientes personas para que sea un experimento estadísticamente válido y esté dentro del marco de las leyes locales, “todo vale” en la experimentación.

Las pruebas A/B también dependen de datos personales para rastrear las respuestas que se dan en los experimentos. Si recibes un correo electrónico de una campaña, por ejemplo, la campaña seguramente está rastreándote para saber si lo abriste o no y cómo interactuaste (dónde y cómo hiciste clic, etc.). Incluso pueden llegar a la conclusión de que eres más o menos susceptible a votar a alguien según si te sales de una lista de correos o si abres los correos poco tiempo después de que lleguen a tu buzón de entrada.

Algunos ejemplos

Reino Unido: Dominic Cummings, director de la campaña Vote Leave (Vota Salir) durante el referéndum de 2016 en el que se planteaba la salida de Reino Unido de la Unión Europea (conocido también como el referéndum Brexit), describe cómo la campaña utilizó datos personales y realizó experimentos para ayudarles a ganar. Según Cummings, a través de realizar encuestas a votantes en el Reino Unido, el equipo científico de datos pudo realizar acciones como 'dirigirse a mujeres entre 35 y 45 años que viven en cierto lugar, con ciertos grados académicos [...] Básicamente realizamos una serie de experimentos [...] en la esfera digital y filtramos lo que funcionó. La campaña 'Vote Leave' dividió a las personas votantes en tres grupos: quienes apoyaban firmemente quedarse, las que optaban por salirse y quienes estaban indecisas.

Vote Leave invirtió 98% de su presupuesto de marketing en centrar su atención al tercer grupo “indeciso” y probó cinco narrativas. La narrativa ganadora fue 'take back control' (recupera el control).

La investigación sugiere que el término 'recuperar' detonaba en las personas votantes el enojo y disgusto de sentir que habían perdido algo que alguna vez habían tenido—en particular, el 'control'.

Estados Unidos: Gary Coby, director de publicidad digital y recaudación de fondos en la campaña de Trump, relata cómo usaban las pruebas A/B de manera desenfrenada y exagerada. La campaña afirma haber realizado entre 40 y 50 mil variaciones cada día, experimentos que resultaron ser lucrativos.

Como señala Michael Babyak, ex-director de tecnología de marketing en la Convención Nacional Rupublicana (Republican National Convention):[ ‘El equipo de Rendimiento, Optimización & Experimentos de RNC -The RNC Performance, Optimization & Experiments Team- ...] realizó más de 300 pruebas en DonaldJTrump.com entre julio y noviembre de 2016, generando más de $30 millones de USD de beneficio’.

El equipo descubrió que los mensajes a favor de Trump siempre se deshacen de cualquier referencia negativa contra Hillary. Después de las elecciones, en mayo de 2018, Coby declaró en Twitter que el equipo tenía más de 4,000 anuncios activos destinados a ‘probar y aprender’, ampliando su búsqueda y obtención de conocimientos e información más allá de las elecciones.

5_19-us-state-voter-list

Captura de pantalla del folleto RNC Testing, publicado en www.scribd.com. Muestra cómo la campaña de Donald Trump probó dos imágenes de fondo en su página de donativos. La imagen de Trump funcionó un 80% mejor que la imagen de Clinton.
Fuente: RNC Testing Booklet, accessed 7 January 2019.

¿Cómo sé si están usando estas tecnologías conmigo?

Es muy probable que hayas formado parte de alguna prueba A/B. Como describe Christian Rudder, presidente de OKCupid, en su blog en 2014: ‘¡Adivina qué! Si usas internet, están realizando cientos de experimentos contigo todo el tiempo, en todos los sitios. Así funcionan las páginas web’.

Otra persona comenta: ‘Cada producto, marca, representante político, organización benéfica y movimiento social intenta manipular tus emociones en cierto grado y utilizan pruebas A/B para averiguar cosas’. Las pruebas A/B son una práctica estándar para casi cualquier entidad que tiene presencia en línea. Aunque puedes identificar experimentos en los que participaste inspeccionando hipervínculos o analizando tus cookies de terceros, no hay una forma para completamente saber en qué experimentos de campañas políticas te han incluido.

5_19-us-state-voter-list

Estos anuncios del Ad Archive (Archivo de Anuncios) de Facebook alientan a personas de la India a reunirse y escuchar a los discursos nacionales del Primer Ministro Narendra Modi. Las consignas de la convocatoria son las mismas, mientras que las imágenes varían ligeramente. Los tres anuncios costaron menos de 15 dólares USD y recibieron entre 10 y 60 mil visitas
_Fuente: Facebook Ad Library, accessed 11 March 2019._

Consideraciones

↘ Las pruebas A/B permiten a las campañas probar supuestos y evitar caer en la 'Opinión de la Mejor Persona Pagada' (en inglés HiPPO Highest Paid Person’s Opinion), término de marketing que hace referencia a sólo guiarse por las personas más veteranas o con más poder en los procesos comunes de toma de decisiones. Si un mensaje político se pone a prueba de manera adecuada, tiene el potencial de desacreditar falsos supuestos.

↘ Como señala una persona experta, 'llevada hasta su conclusión lógica, [esta tendencia] puede presentar, a cada votante, un torrente de mensajes únicos, personalizados y constantemente actualizados a través de pruebas A/B[26]. Las pruebas A/B pueden alterarse de manera específica y dirigirse a las personas según sus preferencias personales.

↘ En la medida que los servicios de pruebas A/B se vuelven cada vez más automatizados, los algoritmos pueden crear muchas más variables y combinaciones de texto, videos, imágenes, botones, etc. según la información generada en las campañas. Aparentemente, esto implica que las máquinas—en vez de personas—decidirían qué leemos y vemos, asentando así un precedente en la creación de contenidos políticos personalizados exentos de supervisión humana.

↘ Las personas votantes no suelen saber que están participando en estos experimentos. Es más, se les pide “permiso” (consentimiento) a “escondidas” en la letra pequeña de las políticas de privacidad que las personas usuarias aceptan sin leer. Debido a esta falta de conciencia, no hay forma de optar fuera. Además, tampoco sabemos el impacto que tienen estos experimentos una vez realizados.

5_19-us-state-voter-list

**Las pruebas A/B generan diferentes variables a través de algoritmos computacionales con el fin de decidir qué ve cada persona usuaria: el anuncio más atractivo y personalizado posible. Se muestra una captura de un video promocional anunciando un producto 'creativo y dinámico' ofrecido por Facebook, plataforma hegemónica y campo de experimentación para campañas políticas. En el video, se explica cómo este servicio permite anunciar imágenes, videos, texto, llamados a la acción, presupuestos y audiencias focales ('target' ), además de mostrar cómo decide qué combinaciones funcionan mejor para cada público**
Source: Facebook Dynamic Creative, accessed 7 January 2019.

↘ Las campañas políticas suelen conducir experimentos con personas sin una revisión independiente con contemplaciones éticas.

↘ Las pruebas A/B pueden ser aprovechadas de manera abusiva en la experimentación política—donde se puede poner a prueba una idea y ocultarla (si falla ) o promocionarla (si funciona).

↘ Las pruebas A/B pueden evitar o disimular la apariencia indecisa de cierta persona representante política: puede probar diferentes mensajes de antemano y esgrimar victoriosamente la opción "ganadora". Citamos: 'En vez de buscar consenso o tomar decisiones políticas arriesgadas, los datos empíricos obtenidos de las pruebas A/B pueden brindar la respuesta óptima: "¿Por qué debatir si puedes realizar un experimento?"'

↘ Las pruebas A/B arriesgan 'eludir los procesos de razonamiento al ir directamente a la búsqueda de lo que funciona'. Las campañas orientan su atención a botones y clics en vez de plantear una discusión de asuntos y temas.

↘ Las pruebas A/B dificultan el monitoreo de campañas. En vez dar seguimiento simplemente a un sitio web, ahora los grupos de monitoreo tienen que tomar en cuenta las diferentes variaciones/versiones adentro de un mismo sitio.