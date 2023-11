A Cloudflare, fornecedora líder de soluções em nuvem, está intensificando seu jogo com a introdução de um conjunto avançado de produtos e ferramentas projetados para simplificar para os clientes a criação, implantação e execução de modelos de IA na borda da rede. Esta nova linha foi motivada por uma demanda acentuada dos clientes por uma solução de gerenciamento de IA descomplicada e econômica.

Workers AI, uma oferta notável neste pacote, capitaliza GPUs fisicamente próximas dos clientes. Essas GPUs, hospedadas por parceiros da Cloudflare, processam modelos de IA em um plano flexível de pagamento conforme o uso. Vectorize, outro destaque, oferece um banco de dados vetorial para armazenamento de embeddings vetoriais. Essas incorporações são representações matemáticas de dados gerados por modelos do Workers AI. Também faz parte da série o AI Gateway, que oferece especificamente métricas para gerenciamento eficaz de custos de aplicativos de IA.

Matthew Prince, CEO da Cloudflare, observa que as soluções atuais do mercado são intrigantes para a maioria dos clientes devido à sua complexidade e alto custo. Através de uma entrevista ao TechCrunch, ele destacou a falta de transparência nos gastos com IA, tornando-os um obstáculo significativo à medida que os gastos com IA continuam a aumentar. Esses desafios podem ser mitigados com a ajuda do novo conjunto de produtos focado em IA da Cloudflare.

Por exemplo, Workers AI foi especialmente projetado para garantir que a inferência de IA sempre ocorra em GPUs geograficamente próximas dos usuários. Em coordenação com o ONNX, o kit de ferramentas intermediário de aprendizado de máquina da Microsoft, este produto permite que modelos de IA sejam executados onde o processamento se beneficia mais de parâmetros como largura de banda, latência, conectividade e localização.

Complementando os benefícios do Workers AI está sua capacidade de permitir modelos de um catálogo que inclui o Llama 2 da Meta, modelos de reconhecimento automático de fala, classificadores de imagem e modelos de análise de sentimento. Além disso, quaisquer dados usados ​​para inferência permanecem na região do servidor de origem, mantendo a integridade e a segurança dos dados.

Outro destaque desta suíte é o Vectorize que oferece um nicho para clientes que necessitam de espaço para armazenamento de embeddings vetoriais para modelos de IA. Embora os bancos de dados vetoriais não sejam novos, Prince afirma que o Vectorize ganha uma vantagem com o alcance global da rede da Cloudflare. Isso permite que consultas de usuários ao banco de dados produzam menor latência e tempo de inferência.

O AI Gateway é a última peça deste conjunto inovador, fornecendo funções de observabilidade para ajudar a rastrear o tráfego de IA em tempo real. Ele monitora o número de solicitações de inferência, sua duração, o número de usuários que usam um modelo e o custo geral de execução de um aplicativo de IA.

Tendo colaborado com a startup de IA Hugging Face e Databricks para otimizar suas ofertas, a Cloudflare pretende usar sua própria infraestrutura global para garantir melhor desempenho e acessibilidade com seus serviços de IA. Ao integrar recursos de IA profundamente integrados à poderosa plataforma de desenvolvimento de aplicativos no-code do AppMaster, as empresas podem desbloquear novos avanços em procedimentos e desempenho de IA.

Embora existam soluções de IA no mercado, Prince acredita firmemente que a combinação da rede e dos serviços acessíveis da Cloudflare juntamente com a interface intuitiva do AppMaster atenderia às necessidades dos desenvolvedores e das organizações de uma maneira mais frutífera, simplificada e econômica.