

Motivations
Pour répondre aux demandes de leurs utilisateurs toujours plus exigeants, les sites de rencontres s'adaptent et proposent aujourd'hui de rechercher sa moitié selon une large gamme de critères. L'ennui, c'est que les critères de recherche sont pondérés différemment selon les individus. Certains recherchent avant tout un physique, quand d'autres accordent davantage d'importance à un niveau d'étude, à une religion en commun ou encore à la proximité géographique.
Prenons l'un d'eux en particulier : AdopteUnMec. Son moteur de recherche ne permet pas de filtrer automatiquement :
- Les profils qui commettent trop de fautes d'orthographe dans la description ;
- Les profils "trop populaires" auprès des hommes, et donc inaccessibles à la plupart d'entre-eux ;
- Les femmes qui ne se donnent pas la peine de renseigner une description ;
- Les femmes qui ont quitté le site depuis des mois ;
Objectifs du projet
D'où l'idée d'entraîner un modèle qui attribuerait des scores à chaque profil féminin. Ces scores dépendraient des informations renseignées par les femmes, et traduiraient la probabilité des profils à retenir l'attention d'un homme donné. L'"homme donné" n'aurait ainsi plus qu'à consulter les profils avec un score supérieur à 95% (voire moins selon son niveau de désespoir), économisant par là même son précieux temps. L’intérêt de la partie Machine Learning est donc de prédire, pour n’importe quel homme, les femmes qui ont le plus de chance de lui plaire.

De la collecte à la prédiction...
Un projet marqué par trois grandes étapes :
Collecte des profils, insersion dans une base de données, et enrichissement de la base avec de nouvelles variables.
En savoir plusDescription des profils féminins et masculins à l'aide d'indicateurs statistiques et de représentations visuelles interactives.
En savoir plusEntraînement d'un modèle de machine learning pour prédire les profils intéressant le plus un utilisateur, avec interface web.
En savoir plus