GUÉP
Entity Resolution · Resolução de Entidades

Sua empresa tem 2 milhões de clientes. Ou 1,4 milhão. Ninguém sabe.

O Entity Resolution Kavuka descobre quando registros diferentes são a mesma entidade real, monta o golden record por entidade — com procedência — e conecta o grafo dos vínculos. Matching que raciocina além do texto, treinado no dado brasileiro, em semanas, não anos.

Além do texto
matching que raciocina
Golden record
um por entidade, com procedência
Grafo nativo
vínculos reais conectados
Batch + tempo real
na mesma engine

É a tecnologia por trás do grafo de vínculos da plataforma Kavuka — provada em produção alimentando os motores de antifraude, PLD e risco, agora oferecida como infraestrutura de dados para qualquer empresa grande.

Dados que não sabem quem é quem mentem em tudo que tocam.

O cliente em cinco sistemas

O mesmo cliente cadastrado cinco vezes, com cinco IDs e três grafias. O match por regra quebra a cada exceção e a visão 360 prometida nunca chega.

O MDM do terceiro ano

O projeto de master data no terceiro ano sem golden record entregue — esquemas rígidos, regras determinísticas e a fatura correndo enquanto a base segue duplicada.

O sancionado que escapou pela grafia

A exposição agregada invisível entre sistemas, o limite concedido três vezes ao mesmo grupo e o sancionado aprovado porque o nome veio com uma letra trocada.

Custo A resolução de entidades não é um projeto de dados — é o pré-requisito de todos os outros. O cliente contado em triplicidade, o crédito concedido em duplicata ao mesmo grupo econômico, o sancionado que entra pela grafia e a iniciativa de IA construída sobre a areia da identidade não resolvida: cada decisão tomada sobre dados que não sabem quem é quem nasce errada.

Como funciona

De fontes sujas a uma verdade só, em uma esteira.

  1. 01

    Ingira

    As fontes como estão — esquemas díspares, dados sujos, sistemas legados — ingeridas uma vez só e servidas a múltiplos casos de uso.

  2. 02

    Resolva

    O matching inteligente pareia o que as regras não pareiam: grafias, abreviações, transliterações, dados incompletos e até manipulação intencional.

  3. 03

    Consolide

    O golden record por entidade real: os melhores valores de cada fonte consolidados, com a procedência rastreada e auditável.

  4. 04

    Conecte e sirva

    O grafo liga os vínculos — sócios, endereços, telefones, contas, dispositivos — e os casos de uso consomem sem duplicar os dados.

Cobertura

O motor que resolve identidade de verdade

Uma única plataforma ingere fontes díspares, raciocina sobre a identidade real por trás dos registros e devolve o golden record e o grafo — prontos para alimentar qualquer caso de uso.

Matching inteligente

Pareamento que raciocina além da igualdade de texto

Golden record

Um registro único por entidade, com procedência

Grafo de entidades

Pessoas, empresas, endereços, telefones e contas

Ingestão flexível

Esquemas díspares e dados sujos, uma vez só

Operação dual

Batch e tempo real na mesma engine

Motor nativo brasileiro

Grafias, CPF/CNPJ âncora, societário da Receita

Exposição agregada

O relacionamento total por grupo econômico

Matches explicáveis

Campos, pesos e confiança, revisáveis e auditáveis

Segmentos

Quem resolve a identidade com a Kavuka

Risco

Bancos & Seguradoras

A visão única do cliente e a exposição agregada por grupo econômico — o limite somado corretamente, uma vez só.

Multi-bandeira

Grupos & Varejo

O cliente reconhecido entre empresas, canais e sistemas — o número real de clientes do grupo, enfim conhecido.

Dados

Programas de MDM

O motor que entrega o golden record que a iniciativa de master data prometeu — em semanas, não anos.

Antifraude · IA

PLD & Preparação para IA

O grafo que liga contas, sócios e sinais; e a base com identidade resolvida — o pré-requisito dos modelos de IA.

Blindagem jurídica

A unificação como melhoria de governança

Resolver identidade não é só eficiência de dados — é conformidade. Sob a LGPD, o titular passa a ter um registro, não cinco, com a procedência de cada dado rastreada e cada pareamento explicável. A unificação é um avanço direto de governança.

  • Um titular, um registro: a unificação reduz a duplicação e melhora o exercício de direitos do titular (acesso, correção, eliminação).
  • Matches explicáveis: cada pareamento traz as evidências que o sustentam — campos, pesos e confiança — revisável e auditável.
  • Procedência rastreada: o golden record registra de qual fonte veio cada melhor valor consolidado.
  • Trilha de auditoria completa do ciclo de resolução e das decisões de match e merge.
  • Fontes públicas ou legalmente permitidas; criptografia em trânsito e em repouso; DPA disponível para clientes enterprise.
Quem já opera assim
Descobrimos que tínhamos 30% menos clientes do que o painel dizia — e 30% mais clareza para investir onde importa.
Chief Data Officer · grupo de varejo multi-bandeira
O golden record que o MDM nos prometeu por três anos saiu em semanas. Foi o caminho curto que não existia.
CTO · instituição financeira
O grafo somou a exposição que estava espalhada em quatro sistemas. O sancionado que escapava pela grafia não escapa mais.
Diretor de Risco · seguradora

Quantos clientes você tem de verdade?

Rode a resolução numa amostra da sua base e descubra o número real — em uma reunião, não em um projeto de três anos.

  • Exclusivo para empresas. Sem compromisso de contratação.
  • Dados usados exclusivamente para contato comercial.
  • Resposta de leads enterprise em até 1 dia útil.

Em 15 minutos você vê a plataforma em ação e recebe uma proposta para o seu volume.

O que é entity resolution e por que ele vem antes de tudo

Entity resolution (resolução de entidades) é a tecnologia que descobre quando registros diferentes se referem à mesma entidade do mundo real — a mesma pessoa cadastrada três vezes com grafias distintas, a mesma empresa em cinco sistemas com razões sociais divergentes, o mesmo endereço escrito de dez formas. O resultado se materializa em duas camadas: o golden record, o registro único, completo e confiável de cada entidade — o santo graal que o MDM tradicional prometeu por décadas — e o grafo, as entidades resolvidas conectadas por seus vínculos reais: sócios, endereços, telefones, dispositivos e transações.

A diferença para o MDM tradicional é estrutural. O MDM depende de esquemas rígidos e regras de match determinísticas — pareia apenas o que é idêntico — e por isso leva anos para ingerir e parear e quebra a cada exceção. O entity resolution moderno ingere as fontes como elas estão, com esquemas díspares e dados sujos, e pareia com modelos que raciocinam: reconhecem grafias, abreviações, transliterações, dados incompletos e até manipulação intencional, encontrando matches incrementais mesmo quando a qualidade é ruim. O golden record sai em semanas, não em anos, com mais conexões encontradas — e cada pareamento permanece explicável: os campos, os pesos e a confiança que o sustentam ficam revisáveis e auditáveis.

Um princípio de arquitetura define a categoria: ingerir uma vez, servir múltiplos casos sem duplicação. Em vez de cada iniciativa — visão do cliente, risco, PLD, antifraude, analytics — manter a sua própria cópia dos dados e a sua própria lógica de match, a identidade é resolvida uma vez e servida a todos. A operação é dual: o modo batch resolve a base inteira; o modo tempo real resolve o registro novo na chegada — o cadastro que nunca mais volta a duplicar, e a consulta que já chega com o vínculo conectado. É o argumento que o CTO compra, porque elimina a fragmentação que torna cada projeto de dados mais caro que o anterior.

O Entity Resolution Kavuka é nativo das patologias do dado brasileiro: as variações de nomes brasileiros, o CPF/CNPJ como âncora forte de identidade, os endereços no padrão nacional e o quadro societário da Receita como fonte de vínculo — uma vantagem estrutural sobre engines genéricas. E é provado em produção: é a infraestrutura do próprio grafo de vínculos da plataforma Kavuka, o motor que enxerga o facilitador, a fábrica de contas e a exposição indireta nos casos de antifraude, PLD e risco. Resolver identidade, portanto, não é mais um projeto de dados entre outros — é o pré-requisito de todos. Sem saber quem é quem, o número de clientes mente, a exposição agregada some, o sancionado escapa pela grafia e a iniciativa de IA roda sobre areia. Com a identidade resolvida, a empresa finalmente sabe quantos clientes tem de verdade, vê a exposição real por grupo econômico, fecha o esconderijo da grafia variante e ganha a base limpa que os modelos de IA exigem.

Perguntas frequentes
O que é entity resolution?

É a tecnologia que determina quando registros diferentes se referem à mesma entidade real — pessoa, empresa, endereço, conta — mesmo com grafias divergentes, dados incompletos ou manipulação. O resultado se entrega em duas camadas: o golden record (o registro único confiável de cada entidade) e o grafo (as entidades conectadas pelos seus vínculos reais).

Qual a diferença para o MDM tradicional?

O MDM tradicional depende de esquemas rígidos e regras de match determinísticas — por isso leva anos e quebra nas exceções. O entity resolution moderno ingere as fontes como elas estão e pareia com modelos que raciocinam: o golden record sai em semanas, com mais conexões encontradas.

Como vocês lidam com o dado brasileiro?

O motor é nativo das patologias locais: variações de nomes brasileiros, CPF/CNPJ como âncora forte de identidade, endereços no padrão nacional e o quadro societário da Receita como fonte de vínculo — a vantagem estrutural sobre as engines genéricas.

Os matches são explicáveis?

Sim. Cada pareamento traz as evidências que o sustentam — os campos comparados, os pesos atribuídos e o nível de confiança — revisável e auditável: a transparência que o time de risco e a LGPD exigem.

Funciona em tempo real?

É dual: o modo batch resolve a base inteira de uma vez; o modo tempo real resolve cada registro novo na chegada — o cadastro que nunca mais volta a duplicar, e a consulta que já chega com o vínculo conectado.

Por que entity resolution é o pré-requisito para IA?

Porque modelos de IA aprendem com os dados que recebem. Se a base conta o mesmo cliente três vezes e não sabe quem é quem, o modelo aprende a mentira. Com a identidade resolvida, a IA roda sobre uma base limpa, com cada entidade representada uma única vez.

Como o entity resolution se conecta ao resto do portfólio Kavuka?

É a infraestrutura por baixo de tudo: o grafo de vínculos que alimenta os motores de antifraude, PLD e risco; a base sobre a qual o Data Enrichment enriquece o golden record; e a fundação no Lakehouse onde os dados resolvidos passam a morar. Resolver a identidade primeiro torna cada solução seguinte mais precisa.

Vamos conversar

A próxima decisão de alto impacto começa com os dados certos.

Converse com um especialista GUÉP e descubra onde a inteligência aplicada gera mais valor na sua operação.