Como a Stephen Gould escalou sua capacidade em 30% sem fazer uma única contratação
Neste artigo, respondemos todas as suas perguntas sobre catálogos de dados e compartilhamos o que você deve procurar em uma ferramenta de catálogo de dados.
Executive Summary:
Neste artigo, respondemos todas as suas perguntas sobre catálogos de dados e compartilhamos o que você deve procurar em uma ferramenta de catálogo de dados.
Com os avanços no mundo dos dados, os catálogos de dados estão se tornando rapidamente um componente essencial da gestão moderna de dados. As organizações que já estão aproveitando catálogos de dados veem uma mudança significativa na velocidade e qualidade do acesso aos dados e na tomada de decisões orientadas por dados. Ao contrário, as organizações sem um catálogo de dados que ouviram falar das maravilhas que ele faz frequentemente se perguntam: O que é um catálogo de dados? Por que o catálogo de dados é tão importante? Quais são os benefícios de um catálogo de dados? O catálogo de dados é a solução certa para nosso negócio?
Neste artigo, respondemos todas as suas perguntas sobre catálogos de dados e compartilhamos o que você deve procurar em uma ferramenta de catálogo de dados. Vamos começar:
Em termos simples, um catálogo de dados é uma biblioteca ou inventário de todos os seus conjuntos de dados, visualizações e painéis. É um lugar onde todos os seus dados estão organizados de forma clara, indexados e prontos para uso. Ele usa metadados combinados com ferramentas de gerenciamento e busca de dados para ajudar as organizações a gerenciar seus dados e assistir profissionais de dados a descobrir, entender, confiar em e gerenciar seus dados para fins de governança ou negócios.
A proeminente empresa de pesquisa Gartner define um catálogo de dados da seguinte forma:
"Um catálogo de dados cria e mantém um inventário de ativos de dados através da descoberta, descrição e organização de conjuntos de dados distribuídos. O catálogo de dados fornece contexto para permitir que gestores de dados, analistas de dados/negócios, engenheiros de dados, cientistas de dados e outras linhas de negócio (LOB) consumidores de dados encontrem e entendam conjuntos de dados relevantes com o propósito de extrair valor comercial. Os catálogos de dados modernos, aumentados com aprendizado de máquina, automatizam várias tarefas tediosas envolvidas na catalogação de dados, incluindo descoberta de metadados, ingestão, tradução, enriquecimento e a criação de relacionamentos semânticos entre metadados. Esses catálogos de próxima geração podem, portanto, impulsionar projetos de gestão de metadados empresariais permitindo que usuários empresariais participem na compreensão, enriquecimento e uso de metadados para informar e avançar suas iniciativas de dados e análises."
– Gartner, Catálogos de Dados Aumentados 2019. (Acesso apenas para assinantes do Gartner.)

Os dados são um ativo valioso, mas apenas quando os usuários conseguem entendê-los e transformá-los em informações significativas que deslocam seu potencial máximo. Na era do big data e BI, as organizações não podem mais permitir que usuários empresariais dependam de profissionais de TI e analistas de dados, especialmente dado os enormes volumes de dados que geram. Em uma organização que carece de uma solução de dados, um especialista em TI ou análise normalmente desperdiça semanas tentando encontrar, entender e validar dados, e depois determinar o significado e a lógica comercial por trás deles.
Um catálogo de dados melhora este processo permitindo que os usuários encontrem e acessem facilmente dados confiáveis no momento exato em que precisam. Os catálogos de dados são uma única fonte de informação confiável que dá aos usuários uma visão do que de dados a organização possui. Eles estão se tornando essenciais porque estão ajudando as organizações a se tornarem orientadas por dados e estão orientando os usuários a entender melhor a importância dos dados.
Um catálogo de dados se concentra em ativos de dados e conecta os conjuntos de dados dentro dos ativos com seus metadados relacionados em ativos definidos, significativos e pesquisáveis que todos os consumidores de dados podem facilmente entender e, como resultado, acelerar o tempo para obter insights e tomar decisões comerciais mais inteligentes.
Como as organizações estão enfrentando dificuldades com adoção e gestão de dados, os benefícios de um catálogo de dados são uma mudança drástica. Aqui estão os principais benefícios do catálogo de dados que as organizações podem desfrutar:
Os catálogos de dados fornecem aos usuários as respostas para suas perguntas ao alcance de suas mãos. Obter uma visão unificada de todos os seus dados em toda a sua organização permite que você encontre facilmente os dados certos que precisa e gaste menos tempo procurando por eles e mais tempo analisando-os. Também ajuda a promover colaboração entre uma ampla gama de usuários, incluindo uma combinação de usuários empresariais e técnicos.
Este é um dos benefícios mais poderosos dos catálogos de dados. Os dados devem ser pesquisáveis e facilmente acessíveis, caso contrário, sua equipe pode gastar até 80% do seu tempo procurando pelos dados que precisa. E como os catálogos de dados melhoram a acessibilidade de dados, sua equipe pode focar seu tempo e esforços em tarefas úteis, como agir sobre os insights que obtiveram da análise de dados, em vez de desperdiçar tempo tentando navegar para diferentes fontes para encontrar dados.
Graças aos metadados disponíveis, os usuários podem acelerar o processo de descoberta de dados em até 5 vezes. Eles podem ver instantaneamente a fonte, quem certificou os dados e definições em termos comerciais para que os usuários possam entender se o conjunto de dados que encontraram atende seu propósito.
Não vamos parar de enfatizar a importância de uma cultura organizacional orientada por dados. Quando sua equipe é capaz de acessar dados precisos facilmente, pode transformá-los em insights acionáveis. Tratar os dados como a fonte central de insight para qualquer decisão em qualquer nível e departamento é a chave. Quando todos na sua empresa sabem que contar com dados é a estratégia, começam a usar essa abordagem em sua rotina diária. Uma cultura orientada por dados pode ajudar uma organização a tomar decisões sólidas bem rapidamente, o que pode melhorar os resultados, eliminar riscos e até economizar dinheiro.
Talvez o maior valor dos catálogos de dados possa ser visto no impacto que tem nas atividades de análise de dados. As organizações com implementações bem-sucedidas de catálogo de dados podem garantir que a qualidade e a eficiência da análise de dados sejam substancialmente melhoradas. E quando a análise de dados é feita corretamente, pode levar a clientes mais satisfeitos, novos usuários, maior receita e estratégias bem-sucedidas.
Com o catálogo de dados certo, você pode não apenas reduzir seus esforços de organização de dados pela metade, mas também reduzir os custos. Um catálogo de dados é um investimento com custos reais, mas quando utilizado corretamente para impulsionar o processo de tomada de decisão no momento certo, pode economizar bastante dinheiro a longo prazo e até aumentar seus lucros. O software que oferece catálogos de dados como parte de suas plataformas de análise de dados pode ser caro, mas pode reduzir drasticamente os custos operacionais associados à construção de seu catálogo inicial.
Um dicionário de dados é o conjunto de nomes, atribuições e definições comerciais para elementos de dados e modelos. Também contém registros sobre outros objetos no banco de dados, como propriedade de dados, relacionamentos de dados com outros objetos e outros dados. Os dicionários de dados fornecem informações adicionais sobre relacionamentos entre diferentes tabelas de banco de dados e ajudam a organizar dados de forma clara e facilmente pesquisável.
Então, qual é a diferença entre um catálogo de dados e um dicionário de dados?
Os catálogos de dados normalmente incluem um dicionário de dados dos ativos de dados, o que significa que um dicionário de dados pode ser pensado como um bloco de construção de um catálogo de dados.
Além disso, um catálogo de dados difere de um dicionário de dados pela sua capacidade de buscar e recuperar informações, seus metadados e seu propósito.

Gartner identifica três subcategorias distintas de catálogos de dados, para que você possa determinar qual tipo é o certo para as necessidades do seu negócio:
Esses catálogos de dados para fornecedores ou ferramentas específicas podem ser entregues como parte de um data lake baseado em nuvem ou ferramenta de preparação de dados. E embora dê aos negócios e às pessoas alfabetizadas em dados uma forma de encontrar e analisar facilmente seus dados, ainda tem capacidades limitadas. Em vez de ter que examinar um catálogo de dados para cada ferramenta de dados para encontrar o que você precisa, é muito mais ideal ter um catálogo de dados conectado a todas as suas fontes de dados.
O Gartner define catálogos de dados empresariais como "catálogos de dados generalistas e orientados para negócios para uso mais amplo em governança de informações e infonomia – direcionados ao Chief Data Officer (CDO)".
Este tipo de catálogo de dados é a base do empoderamento de dados – não é apenas um lugar para indexar todas as suas informações, mas também unifica seus dados, usuários e análises para que você possa facilmente cultivar uma cultura orientada por dados.
Como o nome sugere, este tipo de catálogo de dados é usado principalmente por cientistas de dados e engenheiros de dados. Coleta e classifica todas as informações em seus data lakes, mas também tem adaptabilidade limitada em toda a organização e não permite facilmente que usuários empresariais acessem e aprovitem esses dados. Como resultado, construir uma cultura orientada por dados se torna muito difícil.

Como se trata de ter visibilidade mais ampla e acesso melhor e mais profundo aos dados, os catálogos de dados podem ser usados de várias maneiras diferentes. Apresentamos a você alguns casos de uso de como os catálogos de dados podem ser colocados em prática:
Em muitas organizações, os dados estão espalhados por departamentos e armazenados em vários sistemas. Como resultado, as organizações têm dificuldade para organizar, manter e utilizar seus dados de forma eficaz. Um catálogo de dados pode fornecer um local central para encontrar e acessar todos esses dados. Isso ajuda os usuários não apenas a encontrar os dados de que precisam, mas também a entender como eles são usados e se são úteis. Claro, uma solução de análise de autoatendimento com catálogos de dados disponíveis garante que todos os usuários possam fazer isso por conta própria sem esperar e contar com TI. Isso pode aumentar a produtividade e acelerar o tempo para obter insights.
Outro caso de uso de um catálogo de dados é a capacidade de usá-lo para descobrir dados sensíveis que os negócios podem não saber que existem. Esses dados podem ser detalhes do cliente, informações de pagamento ou até senhas. Este é um caso de uso muito útil para catálogos de dados, pois a última coisa que qualquer negócio precisa é ser penalizado com uma multa GDPR porque não estava ciente dos dados que estava armazenando.
Os sistemas de saúde estão coletando uma abundância de dados relacionados a pacientes e coletados a partir de uma variedade de sistemas, incluindo notas do médico, equipamentos de diagnóstico, etc. Um catálogo de dados ajuda cientistas de dados a fornecer novos serviços aos hospitais e instalações de saúde para apoiar melhor o atendimento ao paciente ao servir como um único ponto de referência em todo o hospital para dados de pacientes existentes, bem como novos conjuntos de dados.
O melhor catálogo de dados é aquele que ajuda a tornar sua organização mais orientada por dados. Deve se alinhar com a maioria das prioridades, estratégia de dados e projetos de sua organização. Você precisa procurar um catálogo de dados que possa capacitar seus usuários a obter o máximo proveito de seus dados e tomar decisões mais inteligentes no ponto de impacto. Se o catálogo de dados não conseguir fazer isso, é melhor procurar em outro lugar.
Aqui está o mais que você deve procurar em uma ferramenta de catálogo de dados:
Busca e descoberta de dados – O objetivo principal deste recurso é criar um sistema que torna a descoberta e busca de dados eficientes e abrangentes para que todos os usuários possam obter insights valiosos dos dados com os quais trabalham.

Inteligência de dados – Um catálogo de dados deve ser capaz de aproveitar IA/ML. Todas as tarefas manuais que poderiam ser automatizadas devem ser automatizadas com IA e técnicas de aprendizado de máquina para reduzir o risco de erros humanos. Além disso, melhorar a alfabetização de dados, acelerar o tempo para obter insights precisos e aumentar a preparação de dados. Eles também podem fornecer recomendações de dados aos usuários do catálogo de dados e aos usuários de outros serviços em uma plataforma de dados moderna.
Análises – Um catálogo de dados integrado com análise de dados permite que os usuários encontrem e analisem facilmente dados e operações de catálogo. Também oferece um catálogo de conjuntos de dados, análise de dados e recursos de visualização. Com a ferramenta certa, operações avançadas de dados também estariam disponíveis.

Conectividade poderosa – Ao implementar um catálogo de dados em sua organização, você deve procurar por uma ferramenta que seja capaz de utilizar conectores pré-construídos para uma ampla variedade de fontes, incluindo um SDK de conector aberto para se conectar a qualquer outra fonte.
Colaboração – Os recursos de colaboração do catálogo de dados, como chat, discussões, etc., podem ajudar sua equipe a aprender uma com a outra e construir sobre o trabalho umas das outras. Colaboração é uma das coisas mais importantes no ambiente comercial, especialmente em torno de dados. Os usuários precisam um do outro ajuda e expertise, e suas ferramentas devem ser capazes de oferecer isso, para que o conhecimento não se perca em e-mail ou outros ferramentas de comunicação.
Estes são apenas os recursos principais que você deve procurar em uma ferramenta de catálogo de dados, mas certifique-se também de procurar curadoria de metadados, governança, conformidade, implementação, integração e preços.
O Slingshot torna mais fácil para os usuários serem orientados por dados e encontrar rapidamente os insights de que precisam, fornecendo a eles um extenso catálogo de análises, fontes de dados e conjuntos, visualizações e painéis. Algumas das funções de catálogo de dados do Slingshot incluem recursos de automação alimentados por ML que auxiliam os usuários na adição de contexto comercial aos metadados técnicos; a capacidade de atribuir funções e responsabilidades para garantir que os ativos sejam mantidos e gerenciados consistentemente pelos usuários certos; e certificação de dados para certificar conjuntos de dados, métricas/KPIs e relatórios para promover a mais alta qualidade de dados no catálogo de dados.
Além disso, o Slingshot é uma ferramenta que simultaneamente agrega análise de dados, gerenciamento de projetos e conteúdo, chat e benchmarking de estratégia baseada em metas – tudo em um único aplicativo intuitivo. Graças ao mecanismo BI completo dentro dele, o Slingshot permite que os usuários se conectem facilmente a suas diferentes fontes de dados, analisem dados e criem painéis bonitos ainda interativos em apenas alguns cliques.

Em seu núcleo, o Slingshot é centrado na tomada de decisão orientada por dados e na cultura organizacional. Foi projetado para ajudar as equipes a se manterem atualizadas com dados atuais para campanhas, através de painéis, rastreamento de KPI e planilhas indicadoras de KPI que são convertidas em análise de dados que são facilmente compartilhadas. Também oferece um conjunto de funções estatísticas que permitem receber mais insights de suas visualizações.
Interessado em aprender mais? Teste o Slingshot gratuitamente e veja por si mesmo como ele pode ajudá-lo a aproveitar insights acionáveis, tornando mais fácil para sua equipe utilizar dados, cultivar uma cultura orientada por dados e melhorar a produtividade.