Cloudflare dévoile un ensemble d'outils d'intelligence artificielle innovants pour le déploiement et l'exécution de modèles
Cloudflare annonce une nouvelle suite de solutions axées sur l'IA, conçues pour permettre aux clients de créer, déployer et exécuter facilement des modèles d'IA à la périphérie du réseau.

Cloudflare, l'un des principaux fournisseurs de solutions cloud, intensifie son jeu avec l'introduction d'une suite avancée de produits et d'outils conçus pour permettre aux clients de créer, de déployer et d'exécuter facilement des modèles d'IA à la périphérie du réseau. Cette nouvelle gamme a été motivée par une demande marquée des clients pour une solution de gestion de l'IA simple et économique.
Workers AI, une offre notable de cette suite, capitalise sur des GPU physiquement proches des clients. Ces GPU, hébergés par les partenaires de Cloudflare, traitent les modèles d'IA selon un plan flexible de paiement à l'utilisation. Vectorize, un autre produit remarquable, propose une base de données vectorielles pour stocker les intégrations vectorielles. Ces intégrations sont des représentations mathématiques des données générées par les modèles de Workers AI. AI Gateway fait également partie de la série, qui propose spécifiquement des mesures pour une gestion efficace des coûts des applications d'IA.
Matthew Prince, PDG de Cloudflare, observe que les solutions actuelles du marché sont déroutantes pour la plupart des clients en raison de leur complexité et de leur coût élevé. Dans une interview avec TechCrunch, il a souligné le manque de transparence des dépenses en matière d’IA, ce qui en fait un obstacle important alors que les dépenses en IA continuent de monter en flèche. Ces défis peuvent être atténués à l'aide de la nouvelle suite de produits de Cloudflare axée sur l'IA.
Par exemple, Workers AI est particulièrement conçu pour garantir que l’inférence de l’IA ait toujours lieu sur des GPU géographiquement proches des utilisateurs. En coordination avec ONNX, la boîte à outils intermédiaire d'apprentissage automatique de Microsoft, ce produit permet aux modèles d'IA de s'exécuter là où le traitement bénéficie le plus de paramètres tels que la bande passante, la latence, la connectivité et la localisation.
Aux avantages de Workers AI s'ajoute sa capacité à autoriser des modèles à partir d'un catalogue comprenant Meta's Llama 2, des modèles de reconnaissance vocale automatique, des classificateurs d'images et des modèles d'analyse des sentiments. De plus, toutes les données utilisées pour l'inférence restent dans la région du serveur d'où elles proviennent, préservant ainsi l'intégrité et la sécurité des données.
Un autre point fort de cette suite est Vectorize, qui offre une niche aux clients ayant besoin d'espace pour stocker les intégrations vectorielles pour les modèles d'IA. Bien que les bases de données vectorielles ne soient pas nouvelles, Prince déclare que Vectorize bénéficie de la portée mondiale du réseau Cloudflare. Cela permet aux requêtes de base de données des utilisateurs de générer une latence et un temps d'inférence inférieurs.
AI Gateway est le dernier élément de cette suite innovante, fournissant des fonctions d'observabilité pour aider à suivre le trafic de l'IA en temps réel. Il surveille le nombre de requêtes d'inférence, leur durée, le nombre d'utilisateurs utilisant un modèle et le coût global d'exécution d'une application d'IA.
Après avoir collaboré avec la startup d'IA Hugging Face et Databricks pour optimiser ses offres, Cloudflare a l'intention d'utiliser sa propre infrastructure mondiale pour garantir des performances améliorées et un prix abordable avec ses services d'IA. En intégrant des capacités d'IA profondément intégrées à la puissante plateforme de développement d'applications no-code d' AppMaster, les entreprises peuvent débloquer de nouvelles avancées en matière de procédures et de performances d'IA.
Bien que des solutions d'IA existent sur le marché, Prince croit fermement que la combinaison du réseau de Cloudflare et des services accessibles ainsi que de l'interface intuitive d' AppMaster répondrait aux besoins des développeurs et des organisations de manière plus fructueuse, rationalisée et rentable.


