Las respuestas hasta ahora se han centrado en los datos en sí, lo que tiene sentido con el sitio en el que se encuentra y las fallas al respecto.
Pero soy un epidemiólogo computacional / matemático por inclinación, así que también voy a hablar un poco sobre el modelo en sí, porque también es relevante para la discusión.
En mi opinión, el mayor problema con el papel no son los datos de Google. Los modelos matemáticos en epidemiología manejan datos desordenados todo el tiempo y, en mi opinión, los problemas con ellos podrían abordarse con un análisis de sensibilidad bastante directo.
Para mí, el mayor problema es que los investigadores se han "condenado al éxito", algo que siempre debe evitarse en la investigación. Lo hacen en el modelo que decidieron ajustar a los datos: un modelo SIR estándar.
Brevemente, un modelo SIR (que significa susceptible (S) infeccioso (I) recuperado (R)) es una serie de ecuaciones diferenciales que rastrean los estados de salud de una población a medida que experimenta una enfermedad infecciosa. Los individuos infectados interactúan con individuos susceptibles y los infectan, y luego con el tiempo pasan a la categoría recuperada.
Esto produce una curva que se ve así:
Hermosa, ¿no es así? Y sí, este es para una epidemia de zombis. Larga historia.
En este caso, la línea roja es lo que se está modelando como "usuarios de Facebook". El problema es este:
En el modelo SIR básico, la clase I eventualmente, e inevitablemente, se aproximará asintóticamente a cero .
Debe suceder. No importa si está modelando zombies, sarampión, Facebook o Stack Exchange, etc. Si lo modela con un modelo SIR, la conclusión inevitable es que la población en la clase infecciosa (I) cae a aproximadamente cero.
Hay extensiones extremadamente sencillas para el modelo SIR que hacen que esto no sea cierto: o puede hacer que las personas en la clase recuperada (R) vuelvan a ser susceptibles (S) (esencialmente, serían personas que dejaron Facebook cambiando de "Estoy nunca volver "a" podría volver algún día "), o puede hacer que nuevas personas entren en la población (esto sería poco Timmy y Claire obteniendo sus primeras computadoras).
Desafortunadamente, los autores no se ajustaban a esos modelos. Este es, por cierto, un problema generalizado en el modelado matemático. Un modelo estadístico es un intento de describir los patrones de variables y sus interacciones dentro de los datos. Un modelo matemático es una afirmación sobre la realidad . Puede obtener un modelo SIR que se ajuste a muchas cosas, pero su elección de un modelo SIR también es una afirmación sobre el sistema. Es decir, que una vez que alcanza su punto máximo, se dirige a cero.
Por cierto, las empresas de Internet utilizan modelos de retención de usuarios que se parecen mucho a los modelos epidémicos, pero también son considerablemente más complejos que los presentados en el documento.