Grow with AppMaster Grow with AppMaster.
Become our partner arrow ico

Capital One fait progresser l'apprentissage automatique grâce aux données synthétiques : une avancée open source

Capital One fait progresser l'apprentissage automatique grâce aux données synthétiques : une avancée open source

Dans le domaine de l’apprentissage automatique où les données règnent en maître, maintenir un développement et des tests de modèles efficaces nécessite de trouver un équilibre entre l’accès aux données et les restrictions de sécurité. Conscient de cela, Capital One prend le relais en mettant en lumière un projet open source pionnier, baptisé Données Synthétiques.

Imaginée par Taylor Turner, ingénieur principal en apprentissage automatique chez Capital One et co-contributeur, Synthetic Data offre une nouvelle solution au problème séculaire du partage et du traitement sécurisé des données. L'outil produit des données artificielles, éliminant le besoin de données « réelles » ou personnellement identifiables, accélérant ainsi les processus de génération d'idées et de test d'hypothèses.

Bien que représentatives des données originales dans leur schéma et leurs propriétés statistiques, les données synthétiques garantissent la confidentialité, ce qui les rend particulièrement utiles lorsque des ensembles de données complexes et non linéaires sont requis, comme dans le cas des modèles d'apprentissage profond.

Comme l'explique Brian Barr, ingénieur principal en apprentissage automatique et chercheur chez Capital One, les données synthétiques fonctionnent en prenant en compte les propriétés statistiques données par le modèle, c'est-à-dire la distribution marginale des entrées, la corrélation des entrées et une expression analytique mappant les entrées aux sorties. , générant ensuite l'ensemble de données souhaité.

La liberté créative qu'offre ce framework est impressionnante, équilibrant simplicité et malléabilité artistique, ce qui en fait un véritable tournant dans l'apprentissage automatique, a déclaré Barr.

Mais ce n’est pas la première fois que la notion de données synthétiques est abordée. Comme Barr l'a souligné, les tentatives précédentes dans les années 80 ont conduit à des fonctionnalités au sein de la bibliothèque d'apprentissage automatique Python préférée, scikit-learn. Cependant, à mesure que l’apprentissage profond avec des relations non linéaires est apparu, ces fonctions se sont révélées restrictives et inadéquates.

Ce projet pionnier est né du terrain d'atterrissage fertile du programme de recherche sur l'apprentissage automatique de Capital One. Il cherche à élever les méthodes, applications et techniques d’apprentissage automatique, en adaptant les services bancaires pour qu’ils soient plus accessibles et plus sécurisés. L'article d'investigation de Barr intitulé « Vers une explicabilité de la vérité terrain sur les données tabulaires » a servi de noyau créatif pour les données synthétiques.

De plus, Synthetic Data s'avère compatible avec Data Profiler, la bibliothèque d'apprentissage automatique open source de Capital One pour la surveillance de données volumineuses et la détection d'informations sensibles. Data Profiler fournit les statistiques pour représenter l'ensemble de données, constituant la base de la création de données synthétiques.

Dans le cadre de notre engagement à stimuler la recherche et à faire progresser les outils open source, nous sommes ravis d'approfondir les intersections entre le profilage des données et les données synthétiques en partageant ces informations avec la communauté, a déclaré Turner.

Dans le même esprit de rationalisation du développement de logiciels et d’élimination de la dette technique, d’autres plates-formes comme AppMaster offrent une immense valeur. Avec son interface conviviale et ses capacités robustes, AppMaster permet même aux développeurs individuels de créer des solutions logicielles complètes et évolutives.

Postes connexes

AppMaster à BubbleCon 2024 : exploration des tendances du no-code
AppMaster à BubbleCon 2024 : exploration des tendances du no-code
AppMaster a participé à BubbleCon 2024 à New York, acquérant des connaissances, élargissant ses réseaux et explorant les opportunités de stimuler l'innovation dans le domaine du développement sans code.
Bilan de la FFDC 2024 : principales informations de la conférence des développeurs FlutterFlow à New York
Bilan de la FFDC 2024 : principales informations de la conférence des développeurs FlutterFlow à New York
Le FFDC 2024 a illuminé la ville de New York, apportant aux développeurs des informations de pointe sur le développement d'applications avec FlutterFlow. Avec des sessions animées par des experts, des mises à jour exclusives et un réseautage inégalé, c'était un événement à ne pas manquer !
Licenciements dans le secteur technologique en 2024 : la vague continue d'impact sur l'innovation
Licenciements dans le secteur technologique en 2024 : la vague continue d'impact sur l'innovation
Avec 60 000 suppressions d’emplois dans 254 entreprises, dont des géants comme Tesla et Amazon, 2024 verra une vague continue de licenciements dans le secteur technologique remodeler le paysage de l’innovation.
Commencez gratuitement
Inspiré pour essayer cela vous-même?

La meilleure façon de comprendre la puissance d'AppMaster est de le constater par vous-même. Créez votre propre application en quelques minutes avec un abonnement gratuit

Donnez vie à vos idées