Onde é apresentado o conceito de virtualização de dados aplicado na prática utilizando o PostgreSQL como a plataforma para gerenciá-la, técnicas, conceitos, limitações, utilidades e o valor desta arquitetura alinhado à governança como um todo.
totalmente a movimentação dos dados • junção de fontes de dados diferentes • dados federados • visões expondo interfaces bem definidas • não resolve todos os problemas, mas pode contribuir fortemente para o sucesso de um projeto de bigdata
active metadata to dynamically connect, optimize and automate data integration processes will reduce time to data delivery by 30%. • By 2021, enterprises using a cohesive strategy incorporating data hubs, lakes and warehouses will support 30% more use cases than competitors. • Through 2022, only 20% of analytic insights will deliver business outcomes. • By 2023, data literacy will become an explicit and necessary driver of business value... Fonte: Gartner, 2019
a estrutura de dados • isolamento no acesso às tabelas • é possível proteger o acesso à colunas e linhas nas tabelas originais • a visão é uma consulta, que é sempre executada consumindo processamento no mesmo servidor Tabelas e visões separadas
a estrutura de dados • isolamento no acesso às tabelas • é possível proteger o acesso à colunas e linhas nas tabelas originais • os dados da visão são persistidos • índices podem ser criados para otimização • os dados podem ser atualizados sem bloqueio • usa recursos de armazenamento do cluster • espaço em disco pode ser um problema • pode-se utilizar tablespaces em discos separados Visões materializadas
a estrutura de dados • isolamento no acesso às tabelas • é possível proteger o acesso à colunas e linhas nas tabelas originais • a visão é uma consulta, que é sempre executada consumindo processamento no servidor secundário • a escrita e leitura no primário é poupada desta concorrência no secundário • em todos os casos o usuário consegue ver a estrutura da tabela original Visão + replicação física + leitura no secundário
a estrutura de dados • isolamento no acesso às tabelas • é possível proteger o acesso à colunas e linhas nas tabelas originais • a visão é uma consulta, que é sempre executada consumindo processamento no mesmo servidor • o usuário não consegue ver a estrutura da tabela original Visão + dblink para “localhost”
a estrutura de dados • isolamento no acesso às tabelas • é possível proteger o acesso à colunas e linhas nas tabelas originais • os dados da visão são persistidos • índices podem ser criados para otimização • os dados podem ser atualizados sem bloqueio • usa recursos de armazenamento do cluster • espaço em disco pode ser um problema • pode-se utilizar tablespaces em discos separados Visões com dblink materializadas
é sempre executada consumindo processamento no mesmo servidor • o usuário não consegue ver a estrutura da tabela original • pode ser uma boa otimização se a visão remota for materializada • pode ser uma boa otimização se a visão local também for materializada • dblink só para uma outra base Postgres Usar dblink numa visão para um servidor remoto
distintas • blending de fontes de dados • join-push-down • uma foreign-table pode ser uma partição de uma tabela particionada • pode se conectar a fontes de dados não-relacionais Usar Foreign Tables numa visão para um servidor remoto
os problemas • em se tratando de cloud, algumas extensões podem não estar disponíveis • pode reduzir o tempo para disponibilizar dados para plataformas de BI e Analytics • cresça gradativamente • latência e número de conexões pode ser um problema • row-level-security também pode ser usado na combinação simulando multi-tenancy • Considerações finais