Experian DataLabs emploie un groupe pluridisciplinaire de data scientists titulaires de doctorats et d'ingénieurs en recherche appliquée spécialisés dans Advanced Analytics, le machine learning, et d'autres méthodes statistiques avancées. En plus d'appliquer des techniques de pointe de data science à des situations réelles, DataLabs utilise les nombreuses sources de données Experian en s'appuyant sur le réseau et ressources mondiaux d'Experian.
DataLabs offre aux projets de recherche interne et collaborative un environnement sûr, sécurisé et conforme. Chez Experian Etats-Unis, près d'un pétaoctet de capacité de stockage de données est mis à disposition afin de soutenir les activités de recherche et développement. Plusieurs projets Big Data peuvent être menés simultanément dans ce même environnement.
Le Big Data pose de nouveaux problèmes aux entreprises : il faut bien sûr stocker d'immenses volumes de données et pouvoir y accéder mais aussi pouvoir recouper et interpréter des types très variés de données. DataLabs identifie justement ces futurs besoins des entreprises et propose des solutions adaptées.
Un système de recommandation qui tient compte de la fréquence, de la valeur, de la pertinence, de la diversité et de l'actualité des données. Une implémentation exécute plus de 28 quintillions de calculs et extrait des informations de plus de 5 milliards de transactions. Les approches utilisées sont celles du filtrage collaboratif et de l'indexation des commerçants par similarité.
Algorithmes de calcul de probabilité d'achat en fonction des dépenses passées, avec actualisation quotidienne des profils des consommateurs et des petites entreprises sur la base des transactions enregistrées ; des alertes sont générées chaque fois que des événements se produisent en dehors des paramètres comportementaux attendus. Une implémentation actualise chaque jour plus de 120 millions de profils individuels.
Estimation de revenu sur la base des dépôts automatiques anonymes, via des techniques de clustering avancées. Identification possible de plus de 60 schémas de dépôts, permettant d'identifier le risque de liquidité sur le compte de dépôt et les opportunités de ventes croisées.
Parmi les autres projets: l'évaluation de l'impact de plusieurs jeux de données de réseaux sociaux sur le risque de crédit commercial, l'amélioration de l'estimation de proximité via des données de géolocalisation et l'évaluation de la sensibilité des consommateurs aux changements de prix des produits.