Sua empresa tem 2 milhões de clientes. Ou 1,4 milhão. Ninguém sabe.
O Entity Resolution Kavuka descobre quando registros diferentes são a mesma entidade real, monta o golden record por entidade — com procedência — e conecta o grafo dos vínculos. Matching que raciocina além do texto, treinado no dado brasileiro, em semanas, não anos.
- Além do texto
- matching que raciocina
- Golden record
- um por entidade, com procedência
- Grafo nativo
- vínculos reais conectados
- Batch + tempo real
- na mesma engine
É a tecnologia por trás do grafo de vínculos da plataforma Kavuka — provada em produção alimentando os motores de antifraude, PLD e risco, agora oferecida como infraestrutura de dados para qualquer empresa grande.
Dados que não sabem quem é quem mentem em tudo que tocam.
O cliente em cinco sistemas
O mesmo cliente cadastrado cinco vezes, com cinco IDs e três grafias. O match por regra quebra a cada exceção e a visão 360 prometida nunca chega.
O MDM do terceiro ano
O projeto de master data no terceiro ano sem golden record entregue — esquemas rígidos, regras determinísticas e a fatura correndo enquanto a base segue duplicada.
O sancionado que escapou pela grafia
A exposição agregada invisível entre sistemas, o limite concedido três vezes ao mesmo grupo e o sancionado aprovado porque o nome veio com uma letra trocada.
Custo A resolução de entidades não é um projeto de dados — é o pré-requisito de todos os outros. O cliente contado em triplicidade, o crédito concedido em duplicata ao mesmo grupo econômico, o sancionado que entra pela grafia e a iniciativa de IA construída sobre a areia da identidade não resolvida: cada decisão tomada sobre dados que não sabem quem é quem nasce errada.
De fontes sujas a uma verdade só, em uma esteira.
- 01
Ingira
As fontes como estão — esquemas díspares, dados sujos, sistemas legados — ingeridas uma vez só e servidas a múltiplos casos de uso.
- 02
Resolva
O matching inteligente pareia o que as regras não pareiam: grafias, abreviações, transliterações, dados incompletos e até manipulação intencional.
- 03
Consolide
O golden record por entidade real: os melhores valores de cada fonte consolidados, com a procedência rastreada e auditável.
- 04
Conecte e sirva
O grafo liga os vínculos — sócios, endereços, telefones, contas, dispositivos — e os casos de uso consomem sem duplicar os dados.
O motor que resolve identidade de verdade
Uma única plataforma ingere fontes díspares, raciocina sobre a identidade real por trás dos registros e devolve o golden record e o grafo — prontos para alimentar qualquer caso de uso.
Matching inteligente
Pareamento que raciocina além da igualdade de texto
Golden record
Um registro único por entidade, com procedência
Grafo de entidades
Pessoas, empresas, endereços, telefones e contas
Ingestão flexível
Esquemas díspares e dados sujos, uma vez só
Operação dual
Batch e tempo real na mesma engine
Motor nativo brasileiro
Grafias, CPF/CNPJ âncora, societário da Receita
Exposição agregada
O relacionamento total por grupo econômico
Matches explicáveis
Campos, pesos e confiança, revisáveis e auditáveis
Quem resolve a identidade com a Kavuka
Bancos & Seguradoras
A visão única do cliente e a exposição agregada por grupo econômico — o limite somado corretamente, uma vez só.
Grupos & Varejo
O cliente reconhecido entre empresas, canais e sistemas — o número real de clientes do grupo, enfim conhecido.
Programas de MDM
O motor que entrega o golden record que a iniciativa de master data prometeu — em semanas, não anos.
PLD & Preparação para IA
O grafo que liga contas, sócios e sinais; e a base com identidade resolvida — o pré-requisito dos modelos de IA.
A unificação como melhoria de governança
Resolver identidade não é só eficiência de dados — é conformidade. Sob a LGPD, o titular passa a ter um registro, não cinco, com a procedência de cada dado rastreada e cada pareamento explicável. A unificação é um avanço direto de governança.
- Um titular, um registro: a unificação reduz a duplicação e melhora o exercício de direitos do titular (acesso, correção, eliminação).
- Matches explicáveis: cada pareamento traz as evidências que o sustentam — campos, pesos e confiança — revisável e auditável.
- Procedência rastreada: o golden record registra de qual fonte veio cada melhor valor consolidado.
- Trilha de auditoria completa do ciclo de resolução e das decisões de match e merge.
- Fontes públicas ou legalmente permitidas; criptografia em trânsito e em repouso; DPA disponível para clientes enterprise.
Descobrimos que tínhamos 30% menos clientes do que o painel dizia — e 30% mais clareza para investir onde importa.
O golden record que o MDM nos prometeu por três anos saiu em semanas. Foi o caminho curto que não existia.
O grafo somou a exposição que estava espalhada em quatro sistemas. O sancionado que escapava pela grafia não escapa mais.
Quantos clientes você tem de verdade?
Rode a resolução numa amostra da sua base e descubra o número real — em uma reunião, não em um projeto de três anos.
- Exclusivo para empresas. Sem compromisso de contratação.
- Dados usados exclusivamente para contato comercial.
- Resposta de leads enterprise em até 1 dia útil.
O que é entity resolution e por que ele vem antes de tudo
Entity resolution (resolução de entidades) é a tecnologia que descobre quando registros diferentes se referem à mesma entidade do mundo real — a mesma pessoa cadastrada três vezes com grafias distintas, a mesma empresa em cinco sistemas com razões sociais divergentes, o mesmo endereço escrito de dez formas. O resultado se materializa em duas camadas: o golden record, o registro único, completo e confiável de cada entidade — o santo graal que o MDM tradicional prometeu por décadas — e o grafo, as entidades resolvidas conectadas por seus vínculos reais: sócios, endereços, telefones, dispositivos e transações.
A diferença para o MDM tradicional é estrutural. O MDM depende de esquemas rígidos e regras de match determinísticas — pareia apenas o que é idêntico — e por isso leva anos para ingerir e parear e quebra a cada exceção. O entity resolution moderno ingere as fontes como elas estão, com esquemas díspares e dados sujos, e pareia com modelos que raciocinam: reconhecem grafias, abreviações, transliterações, dados incompletos e até manipulação intencional, encontrando matches incrementais mesmo quando a qualidade é ruim. O golden record sai em semanas, não em anos, com mais conexões encontradas — e cada pareamento permanece explicável: os campos, os pesos e a confiança que o sustentam ficam revisáveis e auditáveis.
Um princípio de arquitetura define a categoria: ingerir uma vez, servir múltiplos casos sem duplicação. Em vez de cada iniciativa — visão do cliente, risco, PLD, antifraude, analytics — manter a sua própria cópia dos dados e a sua própria lógica de match, a identidade é resolvida uma vez e servida a todos. A operação é dual: o modo batch resolve a base inteira; o modo tempo real resolve o registro novo na chegada — o cadastro que nunca mais volta a duplicar, e a consulta que já chega com o vínculo conectado. É o argumento que o CTO compra, porque elimina a fragmentação que torna cada projeto de dados mais caro que o anterior.
O Entity Resolution Kavuka é nativo das patologias do dado brasileiro: as variações de nomes brasileiros, o CPF/CNPJ como âncora forte de identidade, os endereços no padrão nacional e o quadro societário da Receita como fonte de vínculo — uma vantagem estrutural sobre engines genéricas. E é provado em produção: é a infraestrutura do próprio grafo de vínculos da plataforma Kavuka, o motor que enxerga o facilitador, a fábrica de contas e a exposição indireta nos casos de antifraude, PLD e risco. Resolver identidade, portanto, não é mais um projeto de dados entre outros — é o pré-requisito de todos. Sem saber quem é quem, o número de clientes mente, a exposição agregada some, o sancionado escapa pela grafia e a iniciativa de IA roda sobre areia. Com a identidade resolvida, a empresa finalmente sabe quantos clientes tem de verdade, vê a exposição real por grupo econômico, fecha o esconderijo da grafia variante e ganha a base limpa que os modelos de IA exigem.
O que é entity resolution?
É a tecnologia que determina quando registros diferentes se referem à mesma entidade real — pessoa, empresa, endereço, conta — mesmo com grafias divergentes, dados incompletos ou manipulação. O resultado se entrega em duas camadas: o golden record (o registro único confiável de cada entidade) e o grafo (as entidades conectadas pelos seus vínculos reais).
Qual a diferença para o MDM tradicional?
O MDM tradicional depende de esquemas rígidos e regras de match determinísticas — por isso leva anos e quebra nas exceções. O entity resolution moderno ingere as fontes como elas estão e pareia com modelos que raciocinam: o golden record sai em semanas, com mais conexões encontradas.
Como vocês lidam com o dado brasileiro?
O motor é nativo das patologias locais: variações de nomes brasileiros, CPF/CNPJ como âncora forte de identidade, endereços no padrão nacional e o quadro societário da Receita como fonte de vínculo — a vantagem estrutural sobre as engines genéricas.
Os matches são explicáveis?
Sim. Cada pareamento traz as evidências que o sustentam — os campos comparados, os pesos atribuídos e o nível de confiança — revisável e auditável: a transparência que o time de risco e a LGPD exigem.
Funciona em tempo real?
É dual: o modo batch resolve a base inteira de uma vez; o modo tempo real resolve cada registro novo na chegada — o cadastro que nunca mais volta a duplicar, e a consulta que já chega com o vínculo conectado.
Por que entity resolution é o pré-requisito para IA?
Porque modelos de IA aprendem com os dados que recebem. Se a base conta o mesmo cliente três vezes e não sabe quem é quem, o modelo aprende a mentira. Com a identidade resolvida, a IA roda sobre uma base limpa, com cada entidade representada uma única vez.
Como o entity resolution se conecta ao resto do portfólio Kavuka?
É a infraestrutura por baixo de tudo: o grafo de vínculos que alimenta os motores de antifraude, PLD e risco; a base sobre a qual o Data Enrichment enriquece o golden record; e a fundação no Lakehouse onde os dados resolvidos passam a morar. Resolver a identidade primeiro torna cada solução seguinte mais precisa.
Vamos conversar
A próxima decisão de alto impacto começa com os dados certos.
Converse com um especialista GUÉP e descubra onde a inteligência aplicada gera mais valor na sua operação.