Se han publicado algunas publicaciones en las noticias sobre los datos demográficos de los usuarios del sitio.
Si está buscando un equilibrio de género y cuentas falsas, esta es una buena referencia: casi ninguna de las mujeres en la base de datos Ashley Madison utilizó el sitio
Si está buscando un desglose por estado / país, estas son buenas referencias:
- Una gráfica hecha a partir de los datos filtrados de Ashley Madison revela qué estados en los Estados Unidos prefieren hacer trampa
- El número de usuarios de Ashley Madison por estado, en un mapa impactante
- Mapeado: Un mundo de infidelidad, según Ashley Madison.
Teniendo en cuenta que el conjunto de datos está muy sucio, dado el número de perfiles incompletos y perfiles femeninos falsos, todavía podemos hacer un poco de análisis.
Desglose de género normalizado a cuentas totales de ese género:
- ¿Deberías salir en busca de una startup?
- ¿Prefieres tener un compañero dominante, sumiso o neutral? ¿Por qué?
- ¿Cuándo es el momento adecuado para decir “te quiero” a una cita?
- ¿Qué puedo hacer si mi novio está pensando en romper conmigo porque él dice que no es libre y dice que lo empeoré?
- Si un chico atractivo que siempre está en línea borra su cuenta de okcupid, ¿significa que encontró a alguien que vale la pena conservar?
Tenga en cuenta que es probable que los picos se deban a valores predeterminados cuando se utiliza una fecha de nacimiento no especificada. Las modificaciones predeterminadas actuales parecen ser 29 para los perfiles femeninos recién creados y 34 para los perfiles masculinos. Las otras jorobas son probablemente valores predeterminados anteriores o cuentas falsas por lotes.
Del artículo de Gizmodo anterior podemos suponer que una inmersión más profunda en los datos femeninos es inútil. Desde un punto de vista legal, prefiero no mirar los datos de las transacciones de CC, por lo que mirar los datos demográficos de los usuarios está fuera. Sin embargo, todavía podemos mirar los datos de preferencia masculina. Al limitar los perfiles a las cuentas masculinas que han llenado los datos de preferencias y limitar el rango de edad de 18 a 70, obtenemos lo siguiente.
Existe un subconjunto de categorías de preferencias que permanecen consistentemente altas independientemente de la edad del perfil informada:
Hay un subconjunto que disminuye con la edad reportada:
Finalmente, hay un subconjunto que aumenta con la edad informada: