Skip to Content

O que é o Zero Copy? (e como funciona)

Descubra como a integração Zero Copy pode otimizar o acesso aos dados sem a necessidade de replicação, economizando custos, evitando erros e simplificando a gestão de dados em sua empresa.

Como uma plataforma de dados de clientes pode complementar seu data warehouse? Oferecendo acesso instantâneo aos dados sem precisar fazer uma migração completa. 

Lembra da última vez que você se mudou? Provavelmente, você teve que empacotar muita coisa, transportar em um caminhão e desempacotar no novo local — torcendo para que tudo sobrevivesse à viagem.

Imagine se seus móveis e pertences pudessem simplesmente se teletransportar para o novo lugar em perfeito estado. No mundo físico isso ainda não é possível, mas com a integração zero copy, é assim que você pode lidar com os dados dos seus clientes. 

Graças ao zero copy, ou zero ETL (extract-transform-load ou, em português, extração-transformação-carga), é possível compartilhar dados entre dois ou mais bancos de dados sem realmente movê-los.

Isso é uma ótima notícia para empresas que armazenam dados em data warehouses na nuvem, como Snowflake ou Google BigQuery. Muitas delas relutam em adotar uma plataforma de dados de clientes (CDP) porque não querem duplicar dados. 

Não será mais necessário. Com a integração zero copy, os usuários podem obter os benefícios de uma CDP — como harmonização de dados, gestão de identidades, análises integradas e ativação — sem as desvantagens da movimentação física de dados. 

Relatório State of Data Analytics

Entrevistamos mais de 10 mil líderes, analistas e executivos de TI sobre o gerenciamento de dados e a tomada de decisões na era da IA. Conheça todos os insights!

O que é integração zero copy? 

A integração zero copy permite acessar dados que estão em vários bancos de dados diferentes ao mesmo tempo, sem precisar mover, copiar ou reformatar nada. Além de tornar o acesso mais rápido e fácil, reduz custos e o risco de erros que ocorrem quando os dados precisam ser movidos ou alterados. 

Copiar dados de um banco de dados para outro é uma prática comum. Muitas vezes, esse processo envolve uma transformação de dados chamada ETL (extração-transformação-carga). Pode ser uma etapa útil e até necessária na gestão de dados empresariais. 

Mas tem seus desafios. Algumas das diferenças entre os métodos tradicionais (de cópia) e a abordagem zero copy são: 

 Tradicional Zero Copy 
Replicação Dados de origem copiados do local original para o destino Dados permanecem no local original 
Atualizações Dados são precisos apenas até o último ponto de sincronização Dados são acessados em tempo real 
Custo Usuário paga o custo de mover e sincronizar dados Sem custo de movimentação de dados 
Requisitos regulatórios Mais difícil de manter a conformidade devido à governança mais complexa Usuário é responsável apenas pelos dados de origem 
Erros Qualquer movimentação de dados pode introduzir erros ou falhas Sem erros de movimentação 
Manutenção Copiar e sincronizar cria mais complexidade Mais fácil de gerenciar 

Normalmente, a cópia física de dados gera custos de transporte, introduz a possibilidade de erros, complica a governança e o gerenciamento de dados, e cria atrasos no sincronismo dos dados. 

Então, como a integração zero copy funciona? O mecanismo exato varia de plataforma para plataforma e também depende se você está acessando dados da CDP para o data warehouse ou vice-versa. 

Nos exemplos a seguir, usaremos o Salesforce Data Cloud como a CDP e nosso parceiro Snowflake como o data warehouse. Outros fornecedores poderiam ser substituídos sem alterar significativamente a explicação. 

O que é um data warehouse?  

Um data warehouse é basicamente um local confiável para armazenar e acessar dados importantes para o negócio. 

Os data warehouses tradicionais trabalham com dados altamente estruturados em tabelas formatadas e tendem a ser lentos e complicados. Por outro lado, data warehouses modernos, como o Snowflake, podem lidar com quase qualquer tipo de dado, processá-lo rapidamente e são mais fáceis de usar. Como são construídos sobre plataformas de nuvem como Amazon e Google, são mais fáceis de conectar a outros sistemas como CDPs que utilizam as mesmas plataformas. 

Como funciona: da CDP para o data warehouse 

Neste caso, estamos dentro do nosso data warehouse e queremos acessar dados que estão na CDP. Em outras palavras, a informação está saindo da CDP para o data warehouse. Esse processo é, às vezes, chamado de compartilhamento de dados. 

Os passos usuais são: 

1. Identificar os objetos — ou blocos de dados — dentro da CDP que você gostaria de compartilhar. No caso do Salesforce Data Cloud, esses são chamados de objetos de data lake (dados limpos), objetos de modelo de dados (estruturados pelo usuário da CDP para seus casos de negócio) e objetos de insights calculados (para fórmulas como valor vitalício). 

2. Com um simples clique, vincule esses objetos ao alvo do compartilhamento de dados, neste caso, o Snowflake. 

3. Dentro do Snowflake, o usuário pode realizar consultas nos dados do Snowflake, bem como nos objetos vinculados através do compartilhamento de dados — tudo ao mesmo tempo. 

Nos bastidores, o processo cria “tabelas virtuais” que descrevem os dados do Data Cloud para o Snowflake. Uma tabela virtual é como uma janela para dados em um banco de dados, mas em vez de copiar e armazenar dados reais, uma tabela virtual contém apenas a estrutura dos dados. É um plano ou um ponteiro para o lugar certo na CDP para obter os dados — mas os dados em si permanecem na CDP. 

“É possível consultar dados ao vivo no Salesforce a partir do Snowflake e garantir que mudanças nos objetos do Salesforce serão refletidas no Snowflake,” explicou Sriram Sethuraman, gerente de produto do Salesforce Data Cloud. “Isso permitirá que desenvolvedores e cientistas de dados criem modelos de aprendizado de máquina e aplicativos movidos a IA na plataforma Snowflake combinando dados do Salesforce e do Snowflake.” 

Como funciona: do data warehouse para a CDP 

Agora estamos dentro da nossa CDP e queremos acessar dados que estão no nosso data warehouse. Esse processo é chamado de federação de dados. 

Existem muitas boas razões para fazer isso. Data warehouses como Snowflake e Google BigQuery geralmente contêm uma enorme quantidade de dados, incluindo dados transacionais, como compras, e dados de produtos. Embora não sejam dados “típicos” de clientes, essas informações podem ser muito úteis ao tentar calcular o status de lealdade de um cliente ou construir recomendações com base nos detalhes dos produtos que eles compram. 

Por exemplo, veja como você pode acessar dados do data warehouse no Salesforce Data Cloud: 

1. O Salesforce Data Cloud monta tabelas do data warehouse como objetos externos de data lake. (Montagem é um processo que cria um plano de dados virtual, como o descrito acima.) 

2. O Data Cloud realiza suas funções usuais, como gestão de IDs, análise, segmentação, etc. 

3. A CDP pode acessar dados do data warehouse realizando consultas federadas (ou combinadas) que incluem dados no Data Cloud e os objetos fornecidos pelo data warehouse. 

Como a Buyers Edge usa a tecnologia zero copy 

O sucesso de data warehouses nativos da nuvem como Snowflake, Databricks, Google BigQuery e Amazon Redshift faz muito sentido. Vimos muitos clientes ao menos experimentarem essas tecnologias, e muitos as usam como parte integral de suas arquiteturas de dados. No entanto, nenhum data warehouse executa todas as funções de uma CDP, como gestão de identidades e análises amigáveis ao usuário. 

A Buyers Edge — uma empresa líder em otimização de compras na indústria de serviços alimentícios — queria construir um perfil unificado de clientes em uma CDP enquanto acessava dados de compras armazenados em um data warehouse. Seu principal objetivo é fornecer melhores insights sobre os clientes para suas equipes de vendas e marketing. 

Utilizando a conexão zero-copy entre o Data Cloud e seu warehouse, a Buyers Edge obtém acesso aos dados de compra necessários para construir modelos preditivos, permitindo que as equipes de vendas e marketing produzam melhores ofertas, mensagens e experiências para seus potenciais clientes e clientes atuais. 

 “Com a tecnologia zero-copy, acessar dados de clientes armazenados no Salesforce se torna simples, eliminando a necessidade de movimentação, duplicação ou reformatamento de dados,” disse Sean Donahue, chefe de equipe da plataforma Buyers Edge. “Isso economiza tempo e recursos, elimina silos de dados, harmoniza dados para insights e análises, e capacita as empresas com uma visão holística em tempo real de nossos clientes.” 

E à medida que empresas como a Buyers Edge evoluem, suas necessidades também mudam. É por isso que uma tecnologia como zero-copy pode ajudá-las e a outras empresas a construir uma estratégia de gerenciamento de dados mais flexível. 

Afinal, grandes empresas têm, em média, 976 aplicações diferentes rodando seus negócios, e a quantidade de dados criados, capturados, copiados e consumidos deve mais que dobrar até 2026. Graças ao poder do compartilhamento de dados zero copy, essa explosão de dados será muito mais fácil de aproveitar. 

Preparando os dados para o futuro da Inteligência Artificial

Desbloqueie o poder do Data Cloud para o sucesso do Marketing