Un par de palabras sobre las API de redes sociales. Hace aproximadamente un año escribí una revisión de las API de redes sociales populares para investigadores. Lamentablemente, está en ruso. Aquí hay un resumen:
Twitter ( https://dev.twitter.com/docs/api/1.1 )
- casi todos los datos sobre tweets / textos y usuarios están disponibles;
- falta de datos sociodemográficos;
- gran API de transmisión: útil para el procesamiento de texto en tiempo real;
- muchos envoltorios para lenguajes de programación;
- Es posible obtener una estructura de red (conexiones), pero costosa (1 solicitud por 1 minuto).
Facebook ( https://developers.facebook.com/docs/reference/api/ )
- límites de velocidad: aproximadamente 1 solicitud por segundo;
- bien documentado, caja de arena presente;
- API de gráfico FQL (tipo SQL) y «Rest regular»;
- datos de amistad y características sociodemográficas presentes;
- una gran cantidad de datos está más allá del horizonte de eventos : solo los datos de amigos y amigos de amigos están más o menos completos, casi nada podría investigarse sobre usuarios aleatorios;
- algunos errores extraños de la API, y parece que a nadie le importa (por ejemplo, algunas características disponibles a través de FQL, pero no a través del sinónimo Graph API).
Instagram ( http://instagram.com/developer/ )
- límites de velocidad: 5000 solicitudes por hora;
- API en tiempo real (como Streaming API para Twitter, pero con fotos): la conexión es un poco complicada: se utilizan devoluciones de llamada;
- falta de datos sociodemográficos;
- fotos, filtros de datos disponibles;
- imperfecciones inesperadas (por ejemplo, es posible recopilar solo 150 comentarios para publicar / foto).
Cuadrangular ( https://developer.foursquare.com/overview/ )
- límites de velocidad: 5000 solicitudes por hora;
- reino de datos geosociales :)
- bastante cerrado de investigaciones debido a problemas de privacidad. Para recopilar datos de checkins, es necesario crear un analizador compuesto que funcione con 4sq, bit.ly y las API de Twitter a la vez;
- de nuevo: falta de datos sociodemográficos.
Google+ ( https://developers.google.com/+/api/latest/ )
- aproximadamente 5 solicitudes por segundo (intente verificar);
- métodos principales: actividades y personas;
- Al igual que en Facebook, se ocultan muchos datos personales para usuarios aleatorios;
- falta de datos de conexiones de usuario.
Y fuera de competencia: revisé las redes sociales para lectores rusos, y la red # 1 aquí es vk.com . Está traducido a muchos idiomas, pero es popular solo en Rusia y otros países de la CEI. Enlace de documentos de API: http://vk.com/dev/ . Y desde mi punto de vista, es la mejor opción para la investigación casera de redes sociales. Al menos, en Rusia. Es por eso:
- límites de velocidad: 3 solicitudes por segundo;
- texto público y datos de medios disponibles;
- datos sociodemográficos disponibles: para usuarios aleatorios, el nivel de disponibilidad es del 60-70%
- las conexiones entre usuarios también están disponibles: casi todos los datos de amistades para usuarios aleatorios están disponibles;
- algunos métodos especiales: por ejemplo, hay un método para obtener el estado en línea / fuera de línea para el usuario exacto en tiempo real, y uno podría crear un horario para su audiencia.