Cómo hacer un test A/B en WordPress

Si hay un tipo de experimento conocido en el mundo del Growth y el CRO, ese es sin duda el test AB. ¿No sabes lo que es growth, CRO ni AB testing? No pasa nada, este post es para ti.

La experimentación es una de las estrategias de optimización de un sitio web más efectivas. Consiste en hacer pruebas siguiendo una metodología científica para dar con la mejor experiencia de usuario posible que provoque la conversión de los visitantes en clientes. Es decir, conseguir que tu web venda más y/o mejor.

El término Growth en este contexto se refiere al crecimiento empresarial, especialmente en áreas como startups, empresas emergentes, marketing digital y estrategias de negocio. Muy vinculado con ello, el CRO, Optimización de la Tasa de Conversión (Conversion Rate Optimization, en inglés), se enfoca en mejorar la proporción de visitantes de un sitio web, o usuarios de una aplicación, que realizan una acción deseada. Esta acción, objetivo del negocio, puede ser comprar un producto, suscribirse a un servicio o completar un formulario, entre otros.

Este concepto se basa en la idea de que determinados cambios en el diseño, el contenido o el flujo de usuario pueden tener un impacto significativo en la tasa de conversión.

En un ecommerce la tasa de conversión sería el resultado de dividir el número de clientes que consigues entre el número de visitantes que recibes. Si multiplicas este número por 100 tienes un valor en tanto por ciento, que es como se indica esta métrica.

Por ejemplo, supón que tu tienda online recibe diez mil visitantes al mes y que 256 personas terminan comprando. Para calcular la tasa de conversión solo tienes que dividir 186 entre 10000 y multiplicarlo por 100 para obtener un 1,86% de Conversion Rate o Tasa de Conversión.

En esta tarea de optimizar la tasa de conversión, el método científico nos ayuda a dar con conclusiones más precisas y fiables. Este marco de trabajo consiste enfocar el proceso cubriendo una serie de etapas:

  1. Observación y comprensión del problema.
  2. Formulación de hipótesis de solución.
  3. Experimentación y pruebas (aquí es donde entran en juego los test AB).
  4. Recopilación y análisis de datos.
  5. Iteración y optimización.
  6. Implementación.
  7. Monitoreo y seguimiento.

Un ejemplo práctico de este enfoque podría ser el proceso de optimización de la captación de contactos a través de un formulario.

Imagina que tienes una página en tu sitio web orientada a que tus visitantes se suscriban a un newsletter y quieres trabajar en mejorar el número de usuarios que terminan suscribiéndose, un 1% de las visitas, por ejemplo.

Al estudiar la página donde explicas las ventajas de la suscripción sospechas que la llamada a la acción es poco estimulante y tienes la hipótesis de que un texto más agresivo rendiría mejor. Sin embargo no estás seguro y te gustaría verificarlo.

Para comprobarlo puedes poner en marcha un experimento que valide tu hipótesis comparando el rendimiento de ambas opciones, la actual frente a la más agresiva. Obviamente necesitas un sencillo sistema de analítica que recoja los datos de conversión de cada una de ellas.

Una vez tengas los resultados podrías analizarlos para extraer conclusiones. Quizás no sean determinantes o quizás te induzcan a pensar que aún podrías ser más agresivo y merezca la pena repetir la experiencia.

Una vez que tengas una respuesta definitiva llega el momento de implementar la solución ganadora y comprobar que refleja los mismos resultados de forma global.

Este procedimiento es, de forma muy esquemática, lo que representa la experimentación web.

Qué es un test AB

Aunque existen muchos tipos de experimentos aplicables a la dinámica que he descrito en los párrafos anteriores, los test AB son uno de los más conocidos.

En un test A/B, se divide aleatoriamente a los usuarios (la muestra) en dos grupos: el grupo A y el grupo B. Cada grupo recibe una versión diferente del elemento que se está probando (la llamada a la acción en nuestro ejemplo): el grupo A recibe la versión original (o la versión actual, conocida como «control»), mientras que el grupo B recibe una versión ligeramente modificada, conocida como «variante».

Después de que se ha ejecutado el test durante un período determinado y se han recopilado datos significativos, se analizan los resultados para determinar qué versión tuvo un mejor rendimiento en términos de la métrica específica que se está evaluando, como la tasa de clics, la tasa de conversión, el tiempo en el sitio o la tasa de suscripción del caso anterior.

Como ves, es realmente simple pero para que sea fiable hay que tener en cuenta algunos detalles estadísticos que no son en absoluto banales. Aunque las herramientas de AB testing que verás más adelante ya se ocupan de estos aspectos es importante que al menos les eches un vistazo para ser consciente de su relevancia.

No te preocupes si se te atraganta alguna, las herramientas te ayudarán a cuantificar la fiabilidad del resultado.

Tamaño de la muestra

Es crucial asegurarse de tener un tamaño de muestra lo suficientemente grande para obtener resultados significativos y representativos. Una muestra pequeña puede conducir a conclusiones incorrectas. El tamaño de muestra adecuado depende de varios factores, incluyendo el nivel de confianza deseado, el tamaño del efecto esperado y la variabilidad de los datos.

Si estás trabajando en un sitio con muy poco tráfico puede que la muestra no sea lo suficientemente importante o que tengas que alargar tu test más de lo aconsejable (entrando en juego aspectos como la estacionalidad de tu mercado o las variaciones del comportamiento del usuario a lo largo del tiempo).

Puedes comprobar este dato en tu sistema de analítica. Si no tienes ninguno en marcha, en las Site Tools de tu hosting en SiteGround puedes consultar el número mensual de usuarios para tener una referencia aproximada de la cantidad de personas que visitan que recibe tu sitio.

Nivel de significancia

Este valor determina cuán seguro estás con respecto a si las diferencias observadas entre las versiones A y B son reales o simplemente producto del azar. Comúnmente se utiliza un nivel de significancia del 95% (p-value de 0.05), lo que significa que hay un 5% de probabilidad de que las diferencias observadas sean aleatorias.

Cuanto mayor sea este valor, más seguro estarás del resultado. En muchos casos, con riesgos asumibles para el negocio, puedes arriesgarte a tomar decisiones con niveles de significancia menores.

Potencia estadística

La potencia estadística en un test A/B es una medida de la capacidad de un experimento para detectar una diferencia significativa entre dos variantes si realmente existe esa diferencia. Es decir, indica la probabilidad de que el test identifique correctamente un efecto real, evitando un error de Tipo II (falso negativo), donde el test no logra detectar una diferencia real.

Duración del test

El tiempo durante el cual se ejecuta el test A/B es importante para obtener datos significativos. Se debe considerar un período suficiente para asegurar que se capturen variaciones debido a diferentes condiciones (por ejemplo, días laborables frentes a fines de semana o cualquier otro tipo de estacionalidad) y comportamientos de los usuarios.

Segmentación y control

Debes asegurarte de que los grupos A y B sean lo más similares posible, además de controlar variables externas que puedan influir en los resultados. La segmentación puede ayudar a identificar patrones de comportamiento de diferentes grupos demográficos o de usuario.

No se trata de que sean exactamente idénticos, ya que en un test AB la selección de las muestras es aleatoria pero debes hacerla sobre un universo con unas características comunes que te permitan entender mejor los resultados y tomar decisiones más certeras y eficaces.

Métricas y objetivos claros

Definir las métricas clave que se están evaluando antes de comenzar el test. Es muy habitual que haya personas que empiecen a experimentar antes de tener claro lo que desean validar. Tener objetivos claros ayudará a evaluar de manera efectiva el rendimiento de las diferentes variantes.

No hagas un test si no sabes qué esperas conseguir.

Pruebas continuas

En algunos casos, puede ser útil realizar pruebas continuas o realizar seguimientos periódicos después de la implementación de la variante ganadora para confirmar los resultados y asegurarse de que el cambio sigue siendo efectivo.

Herramientas para hacer test AB

Los factores estadísticos que mencionaba en el apartado anterior pueden darte la sensación de que llevar adelante un test AB puede ser muy complejo. No te voy a engañar, hacerlo «a mano» tiene su dificultad y requiere de ciertos conocimientos estadísticos. Por suerte, como comentaba más arriba, tenemos algunas herramientas que simplifican muchísimo el proceso y te guiarán hasta dar con un resultado confiable.

Google Optimize era una de las más conocidas, probablemente por ser gratis, pero en septiembre de 2023 dejó de estar disponible. Así que olvídate de ella. Descanse en paz.

Las que usan la mayoría de los profesionales del marketing que trabajan con grandes clientes son VWO, Optimizely o AB Tasty, por ejemplo. Todas ellas tienen un coste bastante elevado y aunque funcionan perfectamente sobre WordPress no están específicamente enfocadas en este CMS.

Dentro del ecosistema WordPress tenemos algunas opciones nativas que puedes probar para sacar adelantes un test AB. No voy a engañarte, ni son muchas ni están muy actualizadas aunque por suerte hay una estrella que brilla intensamente.

  • Si usas el constructor visual Divi, dispones de una función interna muy completa para desarrollar test AB.
  • El plugin Split Test For Elementor es una extensión para Elementor que ofrece un servicio similar.
  • A/B Testing for WordPress es uno de los plugin clásicos que, sin tirar de servicio externos, te permitirá montar un test rápidamente.
  •  My WP A/B Testing es la solución más simple y rápida.

Pero si hay una herramienta destacada para diseñar un test AB en WordPress, esa es Nelio AB Testing. Llevo años usándola y siguiendo muy de cerca su crecimiento. Cada paso que da, compruebo que su equipo de desarrollo está más comprometido con esta solución.

Con Nelio AB Testing puedes crear un test AB que compare el rendimiento de dos versiones de:

  • una página
  • una entrada
  • cualquier otro Custom Post Type
  • un titular
  • tu tema
  • un widget
  • un menú
  • una hoja de estilos CSS
  • un producto de WooCommerce
  • una oferta en lote de WooCommerce

Es difícil encontrar algún elemento de tu sitio web sobre el que no puedas ejecutar un test AB con Nelio.
Por si esto fuera poco, Nelio AB Testing incluye una herramienta para crear mapas de calor o heat maps, un tipo de análisis cualitativo muy útil para entender mejor el comportamiento de los usuarios en tu sitio.

Lo mejor de Nelio AB Testing, al margen de la variedad de elementos que puedes testear, es que cuenta con toda la analítica e inteligencia estadística de forma interna. Cada experiencia ofrece un cuadro de mandos muy completo para seguir su evolución o comprobar los resultados una vez que son fiables. De esa forma no te quedará ninguna duda de cuándo has validado o refutado tu hipótesis.

Por otra parte el servicio de Nelio AB Testing es muy limitado en su versión gratuita (poco más que probar la herramienta) y si quieres usarlo de forma intensa tendrás que ir a alguna de sus versiones premium. La más básica es suficiente para los casos más comunes. Como se trata de un pago periódico (en función del número de sesiones de test) puedes darte de alta o de baja de acuerdo a tu calendario de experimentación.

Conclusiones

Los test AB no son la única propuesta de experimentación para la mejora del rendimiento de tu sitio web, pero sí son una de las más conocidas y documentadas. Además, cuentas con herramientas que simplifican muchísimo su puesta en marcha.

Es cierto que si tienes poco tráfico corres algunos riesgos. El principal es la falta de significancia estadística. Con un bajo volumen de tráfico, es más difícil detectar diferencias significativas entre las variantes A y B, lo que significa que no se puede confiar en la fiabilidad de los resultados obtenidos.

Para compensarlo requerirás de un período de test más largo para recopilar suficientes datos con los que hacer una evaluación significativa. Esto puede llevar mucho tiempo y ralentizar el proceso de toma de decisiones.

Además hay que tener en cuenta que en casos de tráfico reducido, los resultados pueden estar influenciados por factores no controlados, como el comportamiento anómalo de ciertos usuarios o la variabilidad natural en la interacción con el sitio. Esto puede sesgar los resultados y llevar a conclusiones incorrectas.

Basarse en datos insuficientes o poco confiables puede hacerte tomar decisiones sobre cambios en el diseño, contenido u otras variables del sitio, que afecten negativamente al rendimiento de tu web en lugar de mejorarlo. Por eso es tan importante poner en valor los análisis de resultados que te ofrece Nelio y sus indicadores de fiabilidad para minimizar los riesgos.

Los test AB son una de las metodologías de experimentación más conocidas en el mundo del CRO y el Growth, pero no las únicas. Te invito a profundizar en estas apasionantes disciplinas para encontrar aquellas que se ajusten mejor a tus objetivos, a tu producto digital o a la naturaleza de tu mercado.

Pablo Moratinos

Growth Data Specialist en Product Hackers

Consultor de marketing especializado en analítica digital cuenta con más de 10 años de experiencia ayudando a negocios digitales a mejorar el rendimiento de sus esfuerzos en internet. Es el autor de «Negocios online. Data driven Marketing», de editorial Anaya Multimedia, top ventas en su categoría en Amazon durante su lanzamiento.

Iniciar discusión

Artículos relacionados

Ha llegado el momento de practicar

Ha llegado el momento de practicar

Elige el proveedor de alojamiento que te ayude a comenzar de manera fácil, a construir rápidamente y a crecer fuerte. Está libre de riesgos con nuestra garantía de devolución de dinero de 30 días.