Estoy tratando de encontrar una fórmula, método o modelo para usar para analizar la probabilidad de que un evento específico influya en algunos datos longitudinales. Tengo dificultades para averiguar qué buscar en Google.
Aquí hay un escenario de ejemplo:
Imagen que posee un negocio que tiene un promedio de 100 clientes sin cita todos los días. Un día, decides que quieres aumentar la cantidad de clientes que llegan a tu tienda cada día, por lo que haces un truco loco fuera de tu tienda para llamar la atención. Durante la próxima semana, verá un promedio de 125 clientes por día.
En los próximos meses, nuevamente decide que desea obtener más negocios, y tal vez mantenerlo un poco más, por lo que intenta otras cosas al azar para obtener más clientes en su tienda. Desafortunadamente, no eres el mejor vendedor, y algunas de tus tácticas tienen poco o ningún efecto, y otras incluso tienen un impacto negativo.
¿Qué metodología podría usar para determinar la probabilidad de que un evento individual impacte positiva o negativamente el número de clientes sin cita previa? Soy plenamente consciente de que la correlación no necesariamente equivale a la causalidad, pero ¿qué métodos podría usar para determinar el probable aumento o disminución de la caminata diaria de su negocio en el cliente después de un evento específico?
No me interesa analizar si existe o no una correlación entre sus intentos de aumentar el número de clientes sin cita previa, sino más bien si algún evento individual, independiente de todos los demás, fue impactante.
Me doy cuenta de que este ejemplo es bastante ingenioso y simplista, por lo que también le daré una breve descripción de los datos reales que estoy usando:
Estoy tratando de determinar el impacto que una agencia de marketing en particular tiene en el sitio web de su cliente cuando publican contenido nuevo, realizan campañas en redes sociales, etc. Para cualquier agencia específica, pueden tener entre 1 y 500 clientes. Cada cliente tiene sitios web que varían en tamaño desde 5 páginas hasta más de 1 millón. En el transcurso de los últimos 5 años, cada agencia ha anotado todo su trabajo para cada cliente, incluido el tipo de trabajo realizado, la cantidad de páginas web en un sitio web que fueron influenciadas, la cantidad de horas dedicadas, etc.
Utilizando los datos anteriores, que he reunido en un almacén de datos (colocado en un montón de esquemas de estrellas / copos de nieve), necesito determinar qué tan probable era que cualquier pieza de trabajo (cualquier evento en el tiempo) tuviera un impacto en el tráfico golpea cualquiera / todas las páginas influenciadas por un trabajo específico. He creado modelos para 40 tipos diferentes de contenido que se encuentran en un sitio web que describe el patrón de tráfico típico que una página con dicho tipo de contenido puede experimentar desde la fecha de lanzamiento hasta el presente. Normalizado en relación con el modelo apropiado, necesito determinar el número más alto y más bajo de visitantes aumentados o disminuidos que recibió una página específica como resultado de un trabajo específico.
Si bien tengo experiencia con el análisis de datos básicos (regresión lineal y múltiple, correlación, etc.), no sé cómo abordar la solución de este problema. Mientras que en el pasado típicamente he analizado datos con múltiples mediciones para un eje dado (por ejemplo, temperatura vs sed vs animal y he determinado el impacto en la sed que el aumento de la temperatura tiene en los animales), siento que arriba, estoy tratando de analizar el impacto de un solo evento en algún momento para un conjunto de datos longitudinal no lineal, pero predecible (o al menos capaz de modelar). Estoy perplejo :(
Cualquier ayuda, consejos, sugerencias, recomendaciones o instrucciones sería extremadamente útil y estaría eternamente agradecido.