por: Christiane Enéas Silva >> linkedin.com/in/christianeeneassilva/

Para planejar e contar as histórias com dados, precisamos saber fazer as perguntas certas. As perguntas certas nos guiaram em todo escopo de planejamento e execução da história dos dados. Faz parte do temas letramento e fluência em dados.

No contexto, precisamos primeiro:

1. Mapear os Dados/Catalogar e Disponibilizar os Dados
2. Explorar Dados
3. Construir a história
4. Apresentar a história

Planejamento usando o Data Storytelling Canvas
Planejamento usando o Data Storytelling Canvas

Porque é importante saber as perguntas que pretende responder com dados?

Porque em uma especificação de desenvolvimento de software usando bases de dados que já existem, podemos considerar as tabelas e, incluindo as adjacentes para o projeto. Mas em proposições de cenários de dados para ingestão em plataforma de dados para atender ambientes analíticos, temos que filtrar os dados do ambiente operacional que tem a finalidade de habilitar as funcionalidades para atender os processos de negócios nos respectivos sistemas.

Fonte: Microsoft – Dataflows BD

Em muitas empresas este dados já estão modelados (por exemplo na solução Erwin), mas quando priorizamos os dados para o ambiente analítico não precisamos reinventar a roda, podemos espelhar na modelagem que já existe, e apenas fazer ajustes, porque sabemos que não serão levados todas as tabelas e nem todos os campos, somente os priorizados para responder as perguntas. É validar com os DBA’s que entendem da modelagem.

No playbook, da Mckinsey, um Data Custodian (com papeis e responsabilidades) é uma pessoa de TI, que tenha conhecimento especialista sobre a plataforma e que auxiliará no diálogo sobre os dados. Em seguida temos que garantir o mapeamento para compor o catálogo de dados, espelhando as entidades e relacionamentos adequados, os campos e respectivos relacionamentos devem compor os domínios.

Temos algumas ferramentas que atendem bem este cenário, como a virtualização de dados.
A virtualização de dados proporciona uma camada segura e centralizada para catalogar, pesquisar, descobrir e governar os dados unificados e suas relações (como exemplo a solução Denodo).

Eis que aqui, os relacionamentos são coesos, consistentes, embora sendo gravados de forma desnormalizados e com arquivos que são desaclopados, mas se for montar o quebra cabeça com os respectivos dados a conciliação será possível.


Categories:

Comments are closed

Seguir no LinkedIn