A Google Cloud lança uma arquitetura de referência de ligação privada para aplicações RAG

robot
Geração do resumo em andamento

Notícias ME: mensagem, 5 de abril (UTC+8). A Google Cloud publicou recentemente um artigo técnico que apresenta uma arquitetura de referência de ligação privada, concebida especificamente para aplicações de IA generativa com capacidade de geração aumentada por pesquisa (RAG). Esta arquitetura é adequada para cenários em que a comunicação entre sistemas tem de utilizar endereços IP privados e não pode passar pela Internet pública. O seu design utiliza um modelo regional, incluindo uma rede externa e o ambiente da Google Cloud, que é composto por um projeto de router, um projeto de host do Shared VPC e três projetos de serviços dedicados. A arquitetura integra serviços fundamentais como Cloud Interconnect/Cloud VPN, Network Connectivity Center, Cloud Router, Private Service Connect, Shared VPC, Cloud Armor, Application Load Balancer e VPC Service Controls.

O artigo descreve, em detalhe, três vias principais de tráfego — o fluxo de preenchimento de dados de RAG, o fluxo de inferência e o fluxo de gestão e de roteamento — com o objetivo de fornecer, para cargas de trabalho de IA empresariais, uma infraestrutura segura e fiável através de ligações privadas ponta a ponta e de controlos de segurança em camadas. (Fonte: InFoQ)

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar