Todos os blogs

Impulsionando a descoberta e a confiabilidade de dados para uma melhor tomada de decisões de negócios

Liam Yu
Senior Product Solutions Marketing Manager, Integrated Systems

25 de Setembro de 2023


As empresas estão se afogando em dados. Dados estruturados, semiestruturados ou não estruturados para a empresa moderna e orientada por dados são tudo, em qualquer lugar, de uma só vez. Mas isso também é um desafio para as empresas que buscam transformar seus dados em informações utilizáveis para o sucesso dos negócios.

O grande volume de dados está desafiando a capacidade das empresas de encontrar dados confiáveis e seguros para orientar suas decisões de negócios. Os catálogos de dados tradicionais oferecem apenas a descoberta de dados estruturados. Não existe uma solução completa para ajudar as organizações a descobrir dados confiáveis em todos os tipos de dados.

O que é necessário é uma solução que reúna os três principais componentes do quebra-cabeça do desafio dos dados: descoberta de dados, observabilidade e confiabilidade dos dados.

Esses três componentes também se alinham cada vez mais com as necessidades das empresas de aplicar dados para melhorar o desempenho do trabalho, tomar decisões de negócios sólidas e obter valor dos dados que possuem.

Descoberta de dados

Independentemente de os dados estarem em um documento PDF, em um documento do Word, em um banco de dados relacional, em um log ou em uma telemetria registrada por uma máquina, a empresa típica tem grandes quantidades deles. Um estudoopens in a new tab recente calculou o volume total de dados armazenados por uma empresa típica em 10 petabytes (PBs) — uma quantidade equivalente a mais de 23 bilhões de arquivos — dos quais mais da metade (52%) foi considerada dados obscuros, o que significa que são dados que não têm nenhum valor atribuído a eles.

A razão para essa quantidade de dados não classificados é simples: Não há tempo suficiente durante o dia para que qualquer pessoa, em qualquer empresa, dedique tempo para entender qual porcentagem de seus dados é valiosa para a organização. A coleta e a integração desses dados geralmente envolvem a extração manual de várias fontes, formatos, fornecedores de sistemas e uma variedade de locais no local, em várias nuvens e arquiteturas de borda.

O conceito de descoberta de dados é sinônimo de leitura ou criação de perfil desses dados. Novas ferramentas de software de inteligência artificial (IA) e machine learning (ML), como o Pentaho Data Catalog, permitem que as empresas automatizem a classificação, a marcação e o gerenciamento de arquivos de dados para entender a qualidade de seus dados. Essas ferramentas permitem que as empresas entendam o conteúdo e o contexto dos dados, gerando insights sobre esses dados ou seus metadados. Por exemplo, ela pode revelar quantas vezes o nome de alguém é mencionado nos registros médicos dos pacientes de um hospital. Ou pode revelar o número de vezes que a frase “taxa de juros” é usada nos registros financeiros de um cliente.

Isso é crucial para empresas que buscam determinar quanto de seus dados são valiosos para seus negócios, influenciam resultados positivos para os clientes ou geram melhores processos de negócios. Somente automatizando o processo de descoberta de dados as empresas podem dar o primeiro passo para capturar esses tipos de insights sobre seus dados.

Observabilidade de dados

O segundo pilar para uma estratégia de dados bem-sucedida é garantir que os dados sejam visíveis e significativos para seus usuários de negócios. A observabilidade de dados fornece a capacidade de monitorar o uso de dados em toda a empresa. O monitoramento é fundamental para responder a perguntas como: Quem está usando os dados? De onde os dados se originaram? Foram alterados? E se foram alterados, quando, onde, por que e por quem?

A observabilidade dos dados fornece às empresas a capacidade de rastrear e registrar cada arquivo, documento ou registro de dados. Munidas dessas informações, as empresas podem criar uma linha de base para o comportamento normal. Esse entendimento é fundamental para proteger a empresa contra ataques cibernéticos. Isso torna mais fácil para a empresa identificar comportamentos anormais ou anômalos potencialmente ameaçadores.

A observabilidade dos dados também permite que as empresas identifiquem dados que, depois de coletados, nunca foram tocados ou consumidos. Dados “obscuros” ou “mortos” que talvez nunca tenham valor para a empresa. As empresas podem determinar se esses dados não consumidos devem ser movidos para uma mídia de armazenamento menos dispendiosa, arquivados ou retirados. E, por fim, a observabilidade dos dados permite que as organizações vejam como eles são usados nas operações normais do dia a dia. Ela permite que as empresas monitorem os dados em tempo real, aprimorem os processos de negócios com mais agilidade e até mesmo contribuam para atingir as metas de sustentabilidade.

Confiabilidade dos dados

O terceiro pilar de uma estratégia de dados bem-sucedida é determinar se os dados são confiáveis e seguros. É possível confiar nos dados para tomar decisões de missão crítica? A confiabilidade dos dados é possibilitada pelos outros dois pilares da estratégia:

  • Descoberta de dados: A automação em torno da compreensão do que são dados.
  • Observabilidade de dados: Monitorando seu uso em toda a organização.
  • Confiabilidade dos dados: De onde vêm os dados? Qual é a qualidade deles? São precisos? Confio na fonte desses dados? Quem os alterou? Eles são consistentes de ponta a ponta?

Uma única versão da verdade

Uma estratégia de dados construída sobre esses três pilares permite que as empresas apliquem os dados que possuem para melhorar as operações de negócios, permitir uma melhor tomada de decisões de negócios e impulsionar a automação assistida por IA em suas organizações.

A primeira etapa crucial é habilitar a automação para a descoberta de dados. Somente por meio da automação da descoberta de dados as empresas podem obter inteligência sobre todos os seus dados. É a chave para criar uma única versão da verdade, compreendendo a versão correta e mais precisa de seus dados. Os dados que as empresas saberão que são confiáveis e seguros para informar uma melhor tomada de decisões de negócios e impulsionar o sucesso comercial futuro.

Liam Yu é gerente sênior de marketing de produtos, gerenciamento de dados, Hitachi Vantara.