Lar Bases de dados Proteja seu banco de dados: alta disponibilidade para dados de alta demanda

Proteja seu banco de dados: alta disponibilidade para dados de alta demanda

Anonim

Por Techopedia Staff, 7 de dezembro de 2016

Para viagem: O anfitrião Eric Kavanagh discute a disponibilidade com Robin Bloor, Dez Blanchfield e Bert Scalzo da IDERA.

No momento, você não está logado. Faça o login ou inscreva-se para ver o vídeo.

Eric Kavanagh: Senhoras e senhores, olá e bem-vindos novamente. São quatro horas da manhã na quarta-feira, horário do leste dos Estados Unidos, e nos dias de hoje isso pode significar apenas uma coisa se você estiver no mundo dos dados: chegou a hora da Hot Technologies! Sim, de fato.

Meu nome é Eric Kavanagh, serei o anfitrião do show. Ele foi projetado para descobrir o que é bom, o que está acontecendo por aí, quais são as coisas legais que estão sendo usadas na empresa e, é claro, a base de tudo o que fazemos em todo esse campo é o banco de dados. Então, vamos falar sobre como proteger seu banco de dados. O tópico exato é: "Proteja seu banco de dados: alta disponibilidade para dados de alta demanda". Portanto, há um slide sobre o seu verdadeiramente. E, chega de falar comigo, me chame no Twitter, @eric_kavanagh.

Primeiro, este ano é quente, os dados são quentes, o big data é muito quente, mas ainda está meio que no limite. Atualmente, mais empresas de ponta estão aproveitando o big data, a maioria das organizações de pão e manteiga do mundo, ainda estão usando dados tradicionais e, se seus dados estiverem em alta demanda, você deseja garantir que esteja disponível porque quando os sistemas ficam inoperantes, quando os dados estão inacessíveis, é quando você recebe clientes insatisfeitos, possíveis clientes insatisfeitos, gera rotatividade de clientes, insiste em todo tipo de coisa, parceiros, etc. Portanto, você não quer isso.

Vamos aprender com alguns dos melhores hoje em dia - ouviremos nosso próprio Dr. Robin Bloor, especialista em banco de dados de cerca de três décadas consecutivas. Dez Blanchfield, que faz isso há tanto tempo, mas ele começou quando era muito jovem, e Bert Scalzo, do IDERA, que é realmente o faixa-preta do banco de dados. Portanto, não se contenha, pessoal, faça perguntas - a maior parte deste evento é valiosa para você é quando você faz boas perguntas e obtém boas respostas, então envie-as pela janela de bate-papo ou pelo componente de perguntas e respostas do seu console.

E com isso vou entregá-lo a Robin Bloor - leve-o embora.

Dr. Robin Bloor: OK, deixe-me clicar aqui e ver se ele se move - ele se move. Não vou falar particularmente sobre banco de dados. Eu pensei que, você sabe, porque eu estou fazendo a introdução, apresentação da primeira introdução, então eu falarei sobre os níveis de serviço esperados e, claro, a disponibilidade do curso, que é o negócio, que é o tópico do programa de hoje.

E a pergunta é, você sabe, “realmente, o que é disponibilidade? E que papel isso desempenha na maneira como as pessoas administram data centers hoje em dia? ”Uma coisa que eu notei - notei isso na década de 90 - eu estava trabalhando em um site e os usuários começaram a reclamar porque seus e-mails estavam esgotados. 15 minutos.

E foi interessante porque o CTO ou quem estava encarregado da TI tinha, de fato, um dos poucos lugares em que, naquela época, eles haviam determinado os níveis de serviço e o e-mail inativo por 15 minutos não violava o nível de serviço de ninguém . Eu acho que é permitido ficar fora por duas horas, na verdade. Não era possível usar o e-mail, mas você não podia enviar e receber porque o servidor estava fora do ar. E isso meio que me alertou para o fato de que eu notei avançar desde então, que tudo apenas acelera e as expectativas dos usuários também, e isso leva você à situação em que as pessoas podem ter três níveis de serviço, mas geralmente eles começará a reclamar quando os níveis de serviço não forem realmente violados.

Portanto, a definição de níveis de serviço, apenas para fornecer um - bem, pode depender exatamente do que você está falando em termos de níveis de serviço. Falamos sobre sistema ou aplicativo de TI. Normalmente, defina em termos de desempenho, disponibilidade e métrica - em outras palavras, você não pode realmente definir um nível de serviço a menos que possa mensurá-lo; portanto, normalmente há algum tipo de medição envolvida e, normalmente, é sobre tempos de resposta, transações específicas e o disponibilidade dos sistemas durante um período de tempo específico e antes de 1994-1995, era realmente raro que algum sistema estivesse disponível por mais do que o horário normal de trabalho. Então, digamos oito da manhã às seis da noite, para dar um intervalo normal - e as pessoas construíram sistemas e assim - e isso significava - na minha opinião, principalmente com o banco de dados - você pode configurar o banco de dados de uma maneira específica e a janela do lote começou a diminuir, a necessidade de pensar novamente começou a surgir em alguns sistemas e depois em outros sistemas, e então tivemos o advento do serviço ou da arquitetura, que começou a criar dependências entre sistemas que anteriormente não eram dependentes um ao outro, tornando tudo ainda pior. Temos o aperto em termos da disponibilidade dos sistemas.

O que eu estava falando era sobre a disponibilidade, inclui backup e recuperação e inclui - é como se não fosse apenas a disponibilidade nos termos normais de que estamos falando; existem muitas maneiras diferentes pelas quais um aplicativo pode falhar. Você sabe, você pode obter uma falha de hardware ou uma falha no banco de dados, pode ocorrer uma falha de software e existem muitas espécies diferentes dessas coisas. Quando isso ocorre, você precisa se recuperar e, portanto, também precisa voltar. os sistemas. Portanto, é necessário haver algum esquema de backup do sistema e você também, em muitos sites hoje em dia, precisa da capacidade de recuperação de desastres caso um edifício inteiro exploda. E algo que vale a pena mencionar aqui, e vou falar sobre isso em um minuto, mas os processos de negócios também têm níveis de serviço e, de fato, os níveis de serviço do processo de negócios que realmente importam para os negócios. A TI apenas precisa fazer sua parte e de acordo com qualquer acordo.

Os níveis de serviço de TI normalmente são subsidiários dos níveis de serviço do processo de negócios, mas, como era realmente raro há 15 anos para qualquer organização ter níveis de serviço bem definidos, ainda é muito raro as organizações terem níveis de serviço bem definidos para processos de negócios . Isso é algo que está acontecendo agora; não é algo que vem acontecendo há muito tempo.

Essas são as barreiras de aceleração e tempo, vale apenas mencionar as barreiras de tempo. Nós gradualmente nos mudamos para um mundo de processamento de eventos e, por isso, gradualmente nos mudamos para um mundo em tempo real; por isso, gradualmente nos mudamos para a disponibilidade, sendo exigidos 24 por 7, e isso é realmente difícil para muitos sistemas - é difícil de alcançar. Ou é muito caro ou, em alguns casos, talvez você precise alterar os sistemas, até mesmo mudar para um banco de dados diferente, uma versão diferente do software de banco de dados que estamos usando.

Além disso, essas barreiras de tempo - e eu sempre gosto de mencioná-las sempre que possível - são barreiras de tempo nas quais nossos aplicativos se deparam; os aplicativos podem querer ser o mais rápido possível, é quando o software fala com o software. Realmente não há licença aceitável em algumas situações, você quer ser o mais rápido possível e essas situações nos termos de negócios, como situações de mercado, em que a pessoa que acompanha o pedido de compra obtém um preço pior do que alguém quem vem primeiro e, portanto, a velocidade do software realmente importa.

Mas você sabe, abaixo disso, quando você está realmente lidando com - seres humanos - interagindo com - seres humanos, o melhor tempo de resposta que realmente pode ser exigido é de um décimo de segundo, porque esse é o tempo de resposta de um ser humano. Você não precisa ir mais rápido do que isso, porque um ser humano não vai perceber de qualquer maneira. Entre 1, 1 e quatro segundos é um tempo de espera que os seres humanos normalmente toleram, mas assim que você passa cerca de quatro segundos, eles estão fazendo outra coisa e, portanto, você está realmente em uma atividade em lote.

Assim, você pode ver que determinados períodos de tempo e dia, semana e meses para aquelas coisas em que um comportamento em lote faz sentido e, portanto, você não está em um mundo de processamento de eventos e, portanto, a disponibilidade pode ser realmente bastante diferente em termos do que você precisa ser capaz de fornecer. Porém, assim que você estiver no mundo dos eventos, estará em disponibilidade 24 horas por dia, 7 dias por semana e a mudança na tecnologia é um fator, à medida que a tecnologia avança cada vez mais rápido, e a disponibilidade pode não aumentar; apenas permanece do jeito que está.

São camadas de complexidade e não quero aprofundar isso, são apenas três coisas a considerar aqui. Há um nível de serviço de infraestrutura, este é o eixo vertical e, em seguida, existe um nível de serviço de qualquer aplicativo e, em seguida, há um nível de serviço de negócios, que depende um do outro e será necessário levar em consideração se você estiver realmente procurando criar um ambiente responsivo em que os níveis de serviço sejam atendidos, basicamente.

Então você tem, na parte inferior aqui, que são apenas bancos de dados representados, mas você pode fazer qualquer coisa dentro do sistema; você sabe que possui a configuração ininterrupta, o que significa o que diz: nunca irá parar. Você tem a situação de espera em espera, onde, de uma maneira ou de outra, existem maneiras diferentes de alcançá-la, mas de uma maneira ou de outra, se um banco de dados falhar, ele será alternado para uma espera em espera e haverá muito pouco atraso. termos de tempo, até o ponto em que os usuários provavelmente notariam, mas não notariam muito.

O modo de espera quente é mais parecido com a transição de 20 minutos, onde todos ligam para o suporte técnico e reclamam do suporte enquanto o banco de dados está sendo alternado para o modo de espera. Depois, há uma situação de reinicialização em que pode levar um período muito longo. Vale a pena notar que qualquer aplicativo ou banco de dados pode estar em qualquer uma das situações, dependendo do que realmente está acontecendo e do nível de serviço exigido pelo aplicativo.

A partir disso, só quero enfatizar a curva de complexidade. A complexidade deriva de nós e conexões, as dependências. No mundo em que vivemos, o número de nós e conexões envolvidos em qualquer coisa continua crescendo, então você está correndo para esse tipo de curva conveniente. Se você pode observar como a complexidade está aumentando e como as dimensões de tempo estão diminuindo, você sabe dos níveis de disponibilidade, existem metas de tempo, é provável que elas estejam diminuindo?

E a evolução natural, portanto, é direcionada à operação ininterrupta, que é obviamente a mais cara - pelo menos na minha experiência - são as configurações mais caras que você pode criar. De uma maneira ou de outra, qualquer organização que esteja pensando sobre isso precisa realmente pensar não apenas no que está acontecendo agora, mas no que acontecerá no futuro.

Talvez o último ponto que quero enfatizar seja que o gerenciamento dos níveis de serviço é uma atividade contínua; não é algo que você sabe que tem um projeto, você o faz e acabou. Não é, porque as coisas continuam mudando. Dito isto, vou passar a bola para Dez.

Dez Blanchfield: Obrigado Robin. Eu amo o seu slide de abertura. Acabamos de repetir, acho que é “Procurando Nemo 2”, o filme. Você tinha o Nemo procurando disponibilidade na forma de noves, o que eu achei muito fofo. Sempre um ato difícil de seguir. Quando penso em tempo de atividade, disponibilidade e alto desempenho, a primeira imagem que me vem à cabeça, porque eu cresci nas Ilhas Salomão, perto de vulcões e do equador, é um vulcão que entra em erupção no meu data center; sempre tenho essa imagem que é o que pode acontecer se algo der errado. Esta é uma foto do adorável Monte. Etna, que é o canto nordeste da Sicília, que fica ao lado de Catania.

Minha abordagem para isso é ter uma conversa com você e fornecer algumas sugestões no mesmo nível que eu faço regularmente em uma sala de reuniões da C-suites e dos chefes de linha de negócios, com o objetivo de ter uma conversa sobre o que pode impactar sua organização do ponto de vista comercial ou técnico e os tipos de engenharia.

Precisamos pensar e como - o que tiramos disso e como vamos abordar alguns dos desafios de que estamos falando quando falamos em alta disponibilidade e tempo de atividade, principalmente em automação e plataformas.

Portanto, a pergunta que colocamos inicialmente é: o que realmente queremos dizer quando falamos sobre sistemas de banco de dados e disponibilidade da plataforma de banco de dados? O que realmente significa falar sobre o desafio real de disponibilizar algo a um nível, como Robin falou no mapeamento instalado do contrato de nível de serviço do que realmente precisamos e queremos?

Então, a realidade de hoje é que - e, de fato, aqui estão algumas realidades de pico em minha mente - hoje tudo é efetivamente orientado por banco de dados. Existem muito poucos sistemas criados hoje e criados de tal maneira que as coisas são armazenadas em arquivos ou são algum tipo de log simples; invariavelmente tudo é dirigido por banco de dados. Como resultado disso, temos essa necessidade de parar de pensar na disponibilidade desses bancos de dados, nos diferentes sistemas e aplicativos e ferramentas que dependem deles e que dependem deles para prestar os serviços que pretendemos entregar, vender ou consumir . E toda a infraestrutura ao seu redor.

De fato, tanto assim, quando você pensa nas grandes interrupções de dados dos últimos tempos, em particular os nativos digitais ou nativos da nuvem, algumas das empresas que surgiram como Uber e Airbnb e assim por diante, e os PayPals um pouco mais antigos e os eBays do mundo - a escala e o tamanho dessas organizações só são possíveis devido à moderna tecnologia de banco de dados e à moderna infraestrutura de nuvem. Sem isso, sem a capacidade adicional fornecida, eles certamente não existiriam. Imagine um cenário em que você só poderia acessar o eBay entre 9h05 e 9h25, porque estava indisponível pelo resto do dia, porque estava tentando fazer um iCloud ou um backup ou algo parecido, simplesmente não teria trabalhou.

Portanto, e existem outras áreas importantes em que você pensa sobre o nosso dia-a-dia, como varejo, bancos e finanças, companhias aéreas e assim por diante. Os grandes grupos da indústria, como logística da aviação, transporte marítimo, governo como um todo, segurança nacional e polícia, etc. Todas essas indústrias, todos esses segmentos de mercado, todos esses órgãos e grupos dependem de seus ambientes estarem em funcionamento.

Então, com isso em mente, também temos a outra ressalva em que temos que pensar, a outra sugestão que quero deixar você pensar, e é que o nosso mundo agora é o que chamo de "sempre ativo". Estamos permanentemente conectados e esse é um tema que você ouvirá regularmente e eu vou repeti-lo e reiterá-lo. Agora temos smartphones em nossas mãos o dia todo, todos os dias. Nós não os desligamos, os colocamos ao lado da cama, invariavelmente os usamos como despertadores, usamos como câmeras e tiramos fotos, eles empurram essas fotos para a nuvem.

Eles estão sempre ligados, mentalidade permanentemente conectada. De fato, há uma frase que eu gosto de usar, e que agora estamos vivendo a geração Fitbit, que é onde estamos medindo tudo, monitorando tudo, e precisa ser registrada e isso vai para algum lugar.

E há também outra frase com que vou deixar você, ou seja, são nove horas em algum lugar, o tempo todo. É um mundo 24/7/365 em que vivemos. A Terra gira constantemente em torno do Sol e, em algum momento e hora, a cada hora do dia, são nove horas. E isso significa que as pessoas estão saindo da cama e tentando fazer coisas, comprar coisas, instalar coisas etc.

Então, o que queremos dizer quando falamos em alta disponibilidade? Bem, parece realmente óbvio até você começar a mergulhar nos detalhes. Então, você sabe quando pensamos em "OK, o que significa alta disponibilidade?" Bem, a realidade é que não há uma bala de prata. É um conceito bastante complexo, pois Robin relacionou-se com alguns dos tópicos mencionados, como medir disponibilidade e acordos de nível de serviço. Nós mapeamos para coisas como, eu tenho essas perguntas, é tempo de atividade? Preocupamo-nos com coisas como o que chamamos de cinco noves, no qual abordarei em um minuto. Nós nos consideramos com o que está em nossos acordos de nível de serviço? Por exemplo, em acordos de nível de serviço, quero dizer que há atrasos, o acrônimo de três letras para acordos de nível de serviço se tornou cada vez mais crítico nos dias de hoje.

À medida que você passa por todo esse processo local e auto-hospedado para terceirizados para centros de dados de terceiros e serviços gerenciados terceirizados, agora estamos indo para a nuvem. E a realidade é que quando você fala sobre nuvem, são apenas computadores de outras pessoas. E isso significa que você não está executando a infraestrutura, não está executando os sistemas e, invariavelmente, não está executando a nuvem. Você está criando uma infraestrutura configurada como plataforma, por isso é ainda mais importante no serviço da força de vendas. Agora imagine vendas, por exemplo, você sabe que não toca em nenhuma dessas infra-estruturas, basta fazer login em uma interface da web.

Portanto, o único mecanismo que você tem nesse mundo de nuvem e infraestrutura terceirizada de qualquer forma para controlar contratos de nível de serviço, esse é o único mecanismo que você possui e, se as pessoas não estão atendendo à sua instalação, elas perduram multas e uma redução na quantidade de dinheiro que você paga ou simplesmente não paga.

Então, isso traz à mente todo esse desafio de, como você gerencia a alta disponibilidade? Como gerenciamos o tempo de disponibilidade, se não é sua infraestrutura - é tudo sobre SLA, por exemplo. Se é a sua infraestrutura ou mesmo a infraestrutura de outra pessoa como ponto de vista do design. Falamos sobre o balanceamento de carga para modelar a ciência. É uma patente de projeto de tolerância a falhas?

Você executa o ativo ativo ou o modo de espera ativo em suas arquiteturas? Você tem vários servidores, várias plataformas de armazenamento? Como essas plataformas de armazenamento operam? Eles se replicam, se espelham? Você está executando o RAID? Que tipo de RAID você está executando para armazenamento redundante? Você está executando o RAID no nível do disco? Você está executando uma plataforma de armazenamento de objetos que replica entre unidades de modelo e sistemas e unidades de modelo? É N mais um para cada pequeno pedaço de infraestrutura que você possui? Você adiciona outro e está no mesmo datacenter ou em outro datacenter? Você criou uma patente de design que não representa um ponto de venda único, por exemplo?

Todas essas coisas fundamentais, agora parecem conceitos simples, mas quando você entra em cada uma dessas coisas, são coisas muito, muito detalhadas. Quando falamos em disponibilidade, invariavelmente acabamos falando de noves. E o que queremos dizer com noves? Todos nós já ouvimos falar sobre isso, mas vamos pensar no que eles significam por um minuto e por que são importantes.

Então, falamos de um nove, que é apenas 90% da nossa disponibilidade. Eu sei que isso soa muito alto. Então, quando falamos 24 por 7 por 365, se olharmos apenas um ano, por exemplo, quando falamos às nove, 90 por cento do tempo, isso permite trinta e seis dias e meio de inatividade por ano. Vamos arredondar isso para pouco mais de um mês.

Agora pense em qualquer empresa com a qual lidamos todos os dias - seja banco on-line, eBay, PayPal ou plataformas de mídia social como LinkedIn, Twitter ou apenas um varejista em geral - digamos que eu queria reservar um voo para os EUA a partir do dia ensolarado Na Austrália, eu ficaria feliz se quisesse vir para a América daqui a uma semana, se minha companhia aérea favorita estivesse inoperante por trinta e seis dias e meio porque seu fornecedor de serviços disse: "Olha, estamos em 90% do tempo "? Claro que não.

À medida que você avança neste modelo, dois noves: 99%. Bem, isso se torna 3, 65 dias, aproximadamente três dias e meio de inatividade por ano. Isso é um grande negócio? Bem, é se você estiver executando a Black Friday, e você estiver executando uma venda especial e as pessoas só puderem comprar durante esses dois dias.

Três noves se tornam tão pouco quanto 8, 7 horas por ano, mas mesmo 8, 7 horas por ano, são consecutivas oito horas consecutivas do nosso tempo. Bem, isso no setor bancário e financeiro, na saúde - se for um hospital, bem, isso pode custar vidas. À medida que você sobe, quatro noves são 52 minutos, cinco noves são cinco minutos e seis noves são basicamente 30 segundos. Seis noves é extremamente alto, e quando você sobe essa escada, ao subir nesta árvore de natal de noves, quanto mais noves sobe, mais difícil é o design, o ambiente e a plataforma. Quanto mais difícil é fornecer esse serviço, e se você pensar na redução na quantidade de tempo que você tem para executar backups, administração, aplicação de patches, janelas de manutenção para qualquer forma de interrupção - todos os desafios não triviais - e tudo se resume a porcentagens de interrupções, efetivamente.

A chave aqui que eu gostaria de transmitir é que não há bala de prata, como mencionei antes. Quando se trata de disponibilidade, não existe um "tamanho único". Você pode ter um tipo específico de patente de design que se adapte às principais indústrias. Os mesmos desafios são enfrentados por todos os bancos. Alguns podem ser bancos de varejo, outros podem ser bancos premium. Alguns bancos podem estar se concentrando em comércio e investimento, gerenciamento de patrimônio. Alguns podem ser puramente consumidores. Alguns podem usar apenas a Internet e nem ter caixas e lidar apenas com caixas eletrônicos ao distribuir dinheiro. Portanto, nesses cenários, mesmo no setor bancário e de gestão de patrimônio e serviços financeiros como um todo, para cada um deles eles ainda têm seu próprio sabor ou o que precisam quando se trata de disponibilidade.

Então, quando pensamos na disponibilidade em inglês simples, a mistura entre disponibilidade e alta disponibilidade - achamos que são a mesma coisa, mas na verdade são giz e queijo. A disponibilidade é, em termos simples, uma medida de tempo em que um servidor ou processo funciona normalmente ou geralmente, atrelado ao seu uso. Isso significa apenas como descrevemos se está disponível ou não. Quando falamos em disponibilidade, geralmente caímos nessa armadilha de pensar: "Estou fornecendo a forma disponível", versus a alta disponibilidade na proteção da segurança dessa infraestrutura.

A alta disponibilidade, em outro sentido, em inglês simples, é o design no qual você implementa ou alcança algum tipo de resultado e disponibilidade de dados, em particular onde quase todo o tempo - 24/7/365 dias por ano - essa disponibilidade chega a alguns deles noves. Invariavelmente, isso não significa 100%. Tecnicamente, cem por cento não é possível no mundo real, em qualquer ambiente. É muito difícil para um servidor em um sistema operacional com um banco de dados, com uma plataforma em execução e um aplicativo que você pode entregá-lo e espera que ele execute 100%. Então começamos a pensar em projetos. Temos redundâncias, temos vários slides para replicar? Então, quando você o coloca em inglês simples, é interessante a diferença entre o tópico disponibilidade e alta disponibilidade.

Eu pensei em colocá-lo em uma forma gráfica muito simples, apenas para nos dar uma idéia de como isso é quando você começa a enfrentar o desafio de aumentar a disponibilidade na proteção do tempo de atividade do serviço. No canto inferior esquerdo, temos um único nove. Eu expus os cinco noves sobre os quais geralmente falamos. Seis noves é um pouco ultrajante. Quando falamos de cinco noves no canto inferior esquerdo, 35 dias mais ou menos dessa interrupção, é um ambiente de baixo custo e baixa complexidade que você está tentando fornecer porque tem várias coisas que podem falhar e pode ainda atenda aos seus acordos de nível de serviço.

Mas conforme você avança na parte inferior da esquerda para a direita e chega ao ponto em que há mais nove na imagem, você obtém os cenários em que começa a pensar na replicação de sistemas e plataformas. Você precisa pensar em cluster e virtualização de várias partes da infraestrutura. Você precisa pensar na geolocalização desses clusters, em vários sites de data centers e no tipo de setor e segmento de mercado que deseja atingir. Então, que tipo de nível de serviço você precisa conhecer? Que prestação de serviços você está procurando? Áreas que são serviços baseados em cartão em tempo real que informam sobre comunicações. São serviços militares? Portanto, este gráfico vai do canto inferior esquerdo para o canto superior direito e, à medida que você passa por essa curva, o custo e a complexidade aumentam. À medida que você obtém ambientes mais complexos e exigentes, precisará de mais nove.

Este gráfico, por exemplo, faz uma coisa muito semelhante: descreve a história entre o componente de custo versus o componente de disponibilidade desejado. Portanto, no canto superior esquerdo, mapeamos sistemas complexos altamente disponíveis e o custo incorrido se essa disponibilidade cair em comparação com o benefício de ter disponibilidade em zero tempo de inatividade. Por exemplo, se tivermos um ambiente no lado esquerdo em que as coisas estão ruins, podemos incorrer em perdas financeiras. Temos implicações legais que podem ser implicações comerciais no nível da estratégia comercial.

Acho que há todo tipo de problemas potencialmente morais em relação a ter benefícios de um serviço. Se for um setor de saúde e eles começarem a passar pelo custo de uma interrupção, impacto nos clientes, redução na satisfação do cliente, produtividade da equipe, produtividade do usuário, etc. Essas coisas são impactadas se pensarmos em projetar altamente complexo e altamente dependente, ambiente altamente arriscado, onde há risco potencial de interrupção e, portanto, perda.

No lado direito, tentamos apontar para um cenário em que, se investirmos alto custo e planejamento em design, investiremos em implementação inteligente. Investimos no fornecimento de habilidades e recursos às pessoas e temos uma rede altamente conceituada e um ambiente operacional, hardware e software altamente conceituados. Temos alta disponibilidade, mas tem um alto custo. Portanto, o ponto do pêndulo mágico oscilante da posição ideal no meio em que eles se cruzam, onde temos um custo ligeiramente reduzido e uma disponibilidade crescente que apenas faz malabarismos entre os níveis de noves e a alta disponibilidade que é a disponibilidade contínua e isso é um desafio constante para nós, como em quanto dinheiro você está disposto a investir para obter o nível de serviço que procura?

Também temos o tópico em que não vou entrar em detalhes, mas quero que você leve isso para longe e pense sobre isso. A diferença entre o tempo médio entre a falha no seu design e o tempo médio de recuperação. Em outras palavras, você está investindo em infraestrutura de melhor qualidade, design de melhor qualidade, hardware e software de melhor qualidade e equipe e recursos qualificados de melhor qualidade para projetar as coisas e reduzir o tempo médio entre falhas, o tempo médio necessário para encontrar a interrupção em oposição diminuir o investimento em infraestrutura, em recursos e design e patentes cegas, a alta capacidade de recuperação? Em outras palavras, se algo quebrar, você tem muito o que conectar. Se alguém tem um laptop e ele morre, você tem um sobressalente. Você entrega a eles e em 30 segundos eles se conectam. Essas são extremidades muito diferentes do poste. O principal deduz que você está projetando com alto custo e alto investimento para evitar falhas, e o inferior diz que “eu vou aceitar que o fracasso está por vir, então vou projetar isso e estar preparado para o fracasso e se recupere rapidamente. "

Como mencionei antes, onde eu poderia dizer: “Minha disponibilidade não é a sua disponibilidade.” Portanto, quando se trata de ambientes de banco de dados e suporte à infraestrutura, executando seu banco de dados e protegendo-o e garantindo alta disponibilidade, não há realmente um balcão único. . Todo mundo tem suas próprias necessidades e desejos. Portanto, você deve se perguntar essas questões fundamentais que eu deixarei com você, e é isso: o que sua organização pode pagar? Não estou falando apenas de dólares e centavos. Estou falando, como organização, o que você pode obter de recursos, tempo e esforço e assim por diante, tanto quanto o nível de disponibilidade pode fornecer? Além disso, o que sua empresa pode oferecer suporte? Portanto, os recursos atuais, as habilidades atuais, a infraestrutura atual, o financiamento atual que você pode obter. Portanto, esse conflito entre o que você realmente pode pagar e o que pode apoiar é um equilíbrio interessante.

Além disso, você deve se fazer as seguintes perguntas: Quais habilidades e tecnologia você possui internamente? Você pode terceirizar parte desse desafio? Você pode então mover as coisas para a nuvem? Se você tiver o serviço de infraestrutura separado do serviço de software, ficará sem essa pilha à medida que avança na pilha. Portanto, você deve investir mais em plataformas e serviços e não se preocupar com a parte da infraestrutura, ou deve considerar o software como uma oferta de serviços porque não precisa se preocupar com a plataforma?

Que tipo de mercado e consumidor ou cliente você está atendendo? Quero dizer, se você é um operador de telecomunicações e alguém tem que atender o telefone e ouvir um tom de discagem o tempo todo, esse é um desafio muito diferente de abrir uma pequena loja de varejo entre segunda e sexta-feira, das nove às cinco e fechar para um hora no almoço como um barbeiro de loja de esquina. Então, você precisa pensar muito sobre como isso funciona e o que isso significa para sua organização, o que você precisa ser capaz de fornecer.

E então a confusão entre o que está no local, o que está hospedado externamente e potencialmente, o que está na nuvem. Como eu disse antes, isso também vem dos desafios do tempo. Portanto, ficamos com a pergunta final que aguardo com expectativa os nossos amigos da IDERA para nos dizer como eles lidam com essas coisas, e essa é a boa combinação entre combinar a disponibilidade desejada e exigida com o desempenho e o que sua empresa precisa e o que precisa. seu mercado e seus consumidores precisam.

E a realidade é que não é tarefa fácil. Vai levar tempo, esforço e dinheiro para pensar sobre essas coisas. Invariavelmente, é o investimento em recursos humanos e capacidade e investimento em software e ferramentas para automatizar alguns desses processos e fornecer a essas pessoas as ferramentas e os sistemas certos para tornar suas vidas não apenas melhores, mas possíveis porque monitoram ambientes de grande escala e protegem e gerenciar esses ambientes de larga escala geralmente está além das capacidades humanas individuais.

Então, com isso em mente, espero que eu tenha montado um cenário para uma ótima conversa para nossos amigos no IDERA falarem sobre sua plataforma e ferramentas, e estou ansioso para fazer algumas ótimas perguntas no final. E eu vou passar adiante.

Dr. Robin Bloor: Tudo bem. Bert, acabei de lhe dar as chaves, leve embora.

Bert Scalzo: Obrigado! Obrigado, Dez e Robin. Vou continuar com o tópico de alta disponibilidade para seus dados. E, na verdade, vou aproveitar muito do que Dez acabou de falar. Portanto, as escolhas, os nove, as trocas, a acessibilidade. Vou tentar colocar isso mais em termos para o administrador do banco de dados ou alguém mais próximo das trincheiras, como eles encarariam isso? Como eles o arquitetariam? E o que essas escolhas meio que significam.

Agora, vou tentar ser independente do banco de dados. Não vou desenhar, por exemplo, uma solução específica do Oracle ou do SQL Server, mas vou desenhar, digamos, uma arquitetura genérica que todos os fornecedores de banco de dados ofereçam, algo nesse sentido. Todos eles chamam isso de nomes diferentes, mas esse é um tipo de escolha que você tem em comum, e eu quero analisar isso da perspectiva de negócios e tecnologia, e como isso se relaciona com os requisitos de negócios.

E quero começar com o que é a solução mais básica de pseudo-alta disponibilidade através das opções que você tem em soluções de nível de armazenamento, soluções de virtualização e soluções de banco de dados. E também quero apresentar a você o fato de que todas as opções também estão disponíveis na nuvem.

Então, novamente, vou tentar permanecer bastante independente do banco de dados. Agora, a maioria das coisas sobre as quais vou falar, sei que elas existem no Oracle, SQL Server, MySQL, PostgreSQL. Existem também alguns fornecedores de terceiros, que fazem ferramentas que também oferecem arquiteturas adicionais que você pode considerar. E, como Dez disse, nenhuma solução é a melhor; tudo depende. Mas há um fato universal no que vamos observar: haverá mais partes móveis, por isso será mais complexo e, portanto, mais caro.

Portanto, todos sabemos que os dados são um ativo importante. E todo mundo sabe que o acesso rápido aos dados é sempre bom. Mas, o acesso confiável aos dados é fundamental. E como ele estava falando com seus nove exemplos, você pode realmente ter 36, 5 dias de inatividade? É fundamental que esses dados estejam disponíveis o tempo todo. Portanto, o tempo de inatividade pode custar uma fortuna, tanto em termos de perda de receita, mas ainda mais importante, em clientes perdidos ou em perda de boa vontade do cliente. Vou te dar um bom exemplo; se um site específico em que eu faço compras for lento, posso tentar encontrar um novo site que venda itens semelhantes a um custo semelhante e que não tenham sites lentos. E assim, não é apenas a perda do cliente, é a boa vontade que o cliente tem em relação a você.

Agora, o hardware é muito mais barato atualmente, portanto, há cada vez mais demanda por alta disponibilidade. E, novamente, eu vou nos levar para a nuvem, quando olharmos para isso. E temos ofertas de vários níveis: os fornecedores de armazenamento, os fornecedores de banco de dados, os fornecedores de virtualização e agora até os fornecedores de nuvem. E o que é realmente interessante com a nuvem é que depois de desenhar todas essas imagens maravilhosas dessas arquiteturas que você pode construir na nuvem, muitas vezes são apenas algumas caixas de seleção que você marca. E você diz: "Desejo replicação em regiões geográficas". Caixa de seleção. "Quero replicar os principais componentes de hardware". Caixa de seleção. E assim, se você entende as imagens, às vezes na nuvem, basta marcar algumas caixas para criar a imagem que você tem em mente.

Agora, o principal é: quais são os requisitos de negócios para alta disponibilidade? Por exemplo, só preciso me preocupar com falhas em um único site ou preciso fazê-lo em vários sites? Em outras palavras, posso ter um centro de computação e não me importo se esse centro fica offline? Não estou exigindo que os negócios se expandam em vários sites. É uma questão de negócios. E é importante saber como a empresa percebe as respostas para essa pergunta, porque isso geralmente define seu orçamento.

Agora, você também deseja examinar o nível de proteção contra falhas. Poderia ser uma falha de energia? Poderia ser uma falha de componente? Como uma NIC ou uma HBA fica ruim, um adaptador de barramento de host. É um disco rígido que vai mal? É uma falha no gabinete de armazenamento? É uma falha do computador? Ou, em alguns casos, é uma falha no site? Isso é diferente do que, em alguns casos, você pode ter uma falha no site, porque o próprio site está offline. Em outro caso, pode ser que uma parte substancial do site esteja offline, mas da sua perspectiva esse é o site inteiro.

E então, como Dez estava falando, qual é a expectativa do tempo para retomar as operações? Essa é uma questão de negócios. Se a empresa disser que você deve retomar as operações em dois minutos, obviamente, isso definirá algumas dessas imagens que eu mostrarei que você funcionará, e algumas delas não serão opções que você pode escolher.

E outra pergunta que surge durante a alta disponibilidade, mas muitas vezes as pessoas esquecem de perguntar: "Ei, negócios, se algo acontecer enquanto eu estiver no meio do processamento de uma transação, o que posso perder com a retomada do sistema? " Em outras palavras, se eu puder recuperar o sistema em dois minutos e não perder mais de 10 segundos, digamos, de transações que estavam em andamento, esse negócio é aceitável? E, novamente, isso definirá o que a empresa está disposta a gastar com isso e, novamente, isso poderá definir quais fotos eu vou mostrar para você aplicar ou não.

Então, vamos começar com a solução mais básica de pseudo-alta disponibilidade. Isso realmente não é alta disponibilidade, mas eu gosto de começar com isso, porque faz as pessoas pensarem da maneira certa. Se eu tiver um servidor e uma matriz de armazenamento, normalmente colocarei várias NICs, placas de interface de rede nesse servidor e as vincularemos para que, se uma NIC falhar, eu ainda esteja ativo. E farei a mesma coisa com meus adaptadores de barramento host, percorrerei vários caminhos por meio de diferentes switches, para que eu tenha várias maneiras de acessar meu armazenamento. E eu tenho uma fonte de alimentação universal e controladores repetitivos dentro do meu storage array, e talvez eu tenha feito algo como RAID 10 com meus discos. Em outras palavras, nesta figura, evitei a falha de um componente em vários níveis. Portanto, não estou vinculado à NIC, nem ao HBA, nem ao controlador, nem ao switch.

Mas se você perceber, o servidor está em vermelho e a matriz de armazenamento está em vermelho. Ainda tenho duas áreas em que, se eles falharem, se meu servidor for, eu estou morto, se meu gabinete de storage for, eu estou morto. Portanto, embora isso não seja realmente uma alta disponibilidade, você começa a ver e olhar a foto e dizer: "Quero uma foto sem vermelho." E esse é realmente o objetivo dessas fotos, para nos apontar na direção certa.

Portanto, a primeira coisa a acontecer é que, como DBA, eu sempre quero colocar a solução de alta disponibilidade como uma implementação de banco de dados, mas pode estar disponível que isso poderia ser feito como uma solução de armazenamento ou que poderia ser uma replicação no nível de armazenamento. No caso da esquerda, eu tenho virtualização de armazenamento. O que está acontecendo é que eu tenho RAID 0 em dois gabinetes de armazenamento diferentes para meus discos, mas tenho RAID 1 nos dois gabinetes de armazenamento diferentes. Em outras palavras, agora posso ter um armário de armazenamento falhar e não estou morto. Portanto, é melhor que a imagem anterior, porque na imagem anterior - lembre-se de que tínhamos vermelho no servidor e vermelho na matriz de armazenamento - e agora fizemos uma pequena melhoria, agora não temos mais vermelho no nível de armazenamento, já usei - a virtualização de armazenamento resolveu esse problema.

Agora, outra maneira de fazer isso - e nem todos os fornecedores fornecem isso - é que você poderá executar a replicação no nível de armazenamento. Não estou falando de replicação de banco de dados, estou falando de replicar sua E / S de bloco para seu armazenamento. E isso pode ser feito no nível de armazenamento. E, novamente, agora eu tenho no lado direito, outra imagem em que removo o vermelho da parte inferior, porque estou usando a replicação de armazenamento.

E assim, esta é outra imagem que pode ou não estar disponível. E a pessoa que gerenciaria isso pode ser seu administrador de armazenamento, e não seu administrador de banco de dados. Eu gosto de trazer isso à tona, porque às vezes as pessoas pensam em "Oh! Alta disponibilidade, deve ser o DBA que resolve esse problema". Isso não e sempre verdade; nesse caso, pode ser o administrador de armazenamento.

Agora, em seguida, podemos fazer a virtualização de servidores como uma solução possível. Agora, se você se lembra, na primeira foto, eu tinha vermelho no servidor e vermelho na matriz de armazenamento. Eu poderia, nesse caso, usando a virtualização, conseguir realocar e, em alguns casos, a realocação é uma espécie de realocação quente e, em alguns casos, pode até ser uma realocação quente. Algumas virtualizações ou hipervisores fornecem a capacidade de mover uma máquina virtual em vôo. E alguns bancos de dados aceitarão prontamente esse movimento em voo. Agora, novamente, nem todos os hipervisores fornecem isso, mas esse é um nível possível de solução. Agora, fiz com que os servidores principais não sejam mais vermelhos, mas ainda tenho a matriz de armazenamento compartilhado e, adivinhe, essa solução pode ser um esforço conjunto entre o administrador do banco de dados e o administrador da virtualização. Ou pode ser apenas o administrador da virtualização, dependendo do nível de realocação suportado nesse hipervisor e nesse banco de dados.

Se você está se perguntando: “Uau, o que ele quer dizer com essa mudança? Dê-me um exemplo específico. ”Por exemplo, na VM, você pode usar o VMotion para mover sua máquina virtual de um host para outro e fazer isso sem tempo de inatividade. Agora, claramente essa imagem anterior ainda tinha um pouco de vermelho. Eu ainda tinha o armazenamento como um ponto único de falha. Então, passamos para a próxima solução, que é, bem, deixe-me combinar o armazenamento e a virtualização do servidor.

Agora, nesse caso, novamente, pode ser o administrador de armazenamento e o administrador de virtualização que estão criando essa solução e agora veja: Eu tenho uma imagem sem vermelho. Tenho alta disponibilidade porque posso realocar a máquina virtual ou o aplicativo ou banco de dados em execução de um servidor para outro e tenho virtualização no meu storage array, fazendo com que ele execute o RAID 1 em dois arrays de armazenamento separados. Eu multi-caminho meus switches e meus HBAs.

Então agora eu criei um sistema de alta disponibilidade e o fiz principalmente não no nível do banco de dados. Em outras palavras, eu usei outras tecnologias para realizar a mesma coisa. Então, essa é uma solução. Em seguida, abordamos o que é chamado cluster escalável de armazenamento compartilhado. Realmente não é uma solução de alta disponibilidade, mas, novamente, eu gosto de mostrá-la para a foto.

E o que acontece aqui é que temos dois servidores executando um banco de dados e é considerado um banco de dados. Não são dois bancos de dados separados; não é como um mestre e um escravo, ou um calor e um resfriado, ou um ativo e um modo de espera. Ou seja, os dois nós trabalham juntos para apresentar um banco de dados lógico. E assim, o que acontece é que, se um nó em particular falhar, você ainda estará ativo. Portanto, ele protege você contra falhas no nível do servidor e o faz basicamente dividindo os recursos do nó, se desejar, mas você ainda tem o ponto único de falha no fundo do disco. Portanto, esse é um cluster escalável de armazenamento compartilhado e a Oracle chama isso de Real Application Cluster ou RAC.

Agora, outra solução é usar um cluster de failover de armazenamento compartilhado. Então, à esquerda, tenho um nó ativo, à direita, tenho um nó passivo, tenho um batimento cardíaco no meio. Eu tenho uma matriz de armazenamento compartilhado, e isso é crítico; você tem que ter isso. E basicamente, o que acontece é que, se o nó ativo encontrar problemas, o nó passivo poderá assumir o controle. Existem problemas de licenciamento para isso. Alguns fornecedores de banco de dados permitem que você tenha o nó passivo com uma licença reduzida por um tempo fixo. Em outros casos, você precisa ter um licenciamento duplicado completo. Tudo depende do fornecedor do seu banco de dados. Mas todos eles suportam esse tipo de imagem que é, se um nó cair, o outro nó poderá assumir o controle.

E, tipicamente, esse é um daqueles cenários em que, quando você passa do nó ativo para o nó passivo, provavelmente, na maioria dos bancos de dados - não em todos - você perderá parte do transações de voo. Em seguida, abordamos o que o administrador de banco de dados realmente pode analisar, que é a replicação de banco de dados, e há duas maneiras diferentes de executar a replicação de banco de dados.

Há replicação física, e o importante é que, no meio desta imagem, você pode ver com a estrela verde que a replicação está sendo feita pelo banco de dados, mas, assim como a virtualização no nível de armazenamento, está sendo feita no bloco nível. Então, estamos repetindo as E / Ss reais do bloco do nó ativo para o nó somente leitura ou passivo. E isso é considerado replicação física.

Agora, deixe-me ir para o próximo slide, porque é quase idêntico e é replicação lógica, e a única coisa que muda na imagem é que no meio, em vez de enviar pelo bloco de E / S, estamos essencialmente enviando pelo log arquivos com os comandos SQL nele. Portanto, em outras palavras, o que estamos replicando não é a E / S física, mas os comandos que causam a E / S física.

E assim, isso geralmente é chamado de envio de logs ou replicação baseada em log. Alguns fornecedores de banco de dados fornecem isso nativamente. Outros fornecedores de banco de dados podem não oferecer isso, mas fornecedores de terceiros oferecem, então essa é uma solução de alta disponibilidade muito popular e é considerada uma solução completa. Mas essa solução é principalmente de responsabilidade do DBA.

Portanto, não estou usando a virtualização para fazer isso. Eu poderia, mas não sou dependente disso. E não estou usando virtualização de armazenamento. Mais uma vez, eu poderia, mas não sou dependente disso. Mas estou criando uma solução com o banco de dados sendo o principal recurso de direção. Portanto, isso é replicação lógica.

Agora, também é possível combinar virtualização de banco de dados e armazenamento. Eu poderia ter, no meu data center, digamos, à esquerda em azul, eu poderia ter virtualização para o armazenamento, para que eu não esteja vinculado a uma matriz de armazenamento específica que falhe. Mas posso estar executando replicação lógica ou baseada em log no nível do banco de dados de um datacenter para outro, para que os comandos também sejam executados no datacenter, resultando em E / S, mas não necessariamente na mesma E / S, porque eu ' não estou enviando o bloco de E / S, nem pela solução de armazenamento nem pelo banco de dados, mas estou enviando os logs e, portanto, os comandos SQL.

E assim, esta é uma imagem muito comum para organizações muito grandes. E eu gosto dessa foto aqui porque se eu tiver que configurar isso no local usando um banco de dados como Oracle, eu posso fazer isso; é uma quantidade considerável de trabalho, é bastante complexo, há muitas partes móveis. Se eu fizer isso na nuvem, posso literalmente dizer: caixa de seleção, quero duas regiões geográficas, quero as regiões separadas por, você sabe, em diferentes continentes, quero virtualização no nível de armazenamento em uma região geográfica específica. Posso até dizer que quero a capacidade de fazer alocação de tipo de virtualização ou definição de alta disponibilidade e, novamente, é outra caixa de seleção.

E a outra coisa que eu gosto na nuvem, há outra caixa de seleção para dizer: "Eu não quero lidar com patches, apenas remendá-los", você sabe, apenas trabalhe no fluxo de trabalho de tudo o que você faz atrás do cenas, mantenha-me sempre atualizado. E assim, enquanto algumas dessas fotos estão ficando muito complexas e podem ser muito difíceis de serem executadas no local, elas estão se tornando muito fáceis de fazer na nuvem.

Agora, o interessante é que é fácil marcar todas as caixas de seleção, mas adivinhe, isso custa mais dinheiro mensalmente. Como se você estiver executando dois data centers, você sabe, há dois data centers na nuvem que está utilizando, pagará mais do que se estivesse usando apenas um. Da mesma forma, se você estiver executando o nível de armazenamento ou a alta disponibilidade da virtualização como uma camada adicional, novamente, poderá haver custos adicionais.

Portanto, é interessante que, embora seja difícil fazer no local e você possa pensar demais, na nuvem é tão fácil, você pode pensar demais. Portanto, sempre saiba como é a imagem e sempre saiba quais são as implicações de custos para qualquer imagem que você esteja criando. Agora, há muito mais combinações do que eu mostrei aqui. Este não é um exemplo completo ou exaustivo. Há novas tecnologias em intervalos regulares, portanto, quem sabe - talvez eu não tenha mostrado uma que surgiu nos últimos três meses. E a alta disponibilidade é muito mais comum do que há dez anos atrás.

De fato, não considero exagero dizer que, para a maioria das grandes organizações, é um requisito comercial obrigatório atualmente. E gosto de voltar a este slide porque acabei de dizer que é um requisito comercial obrigatório. E eu tenho essas duas mesas à direita. A primeira está fora da documentação do SQL Server e a inferior está fora da documentação do Oracle. E o que são, são tabelas para ajudá-lo a escolher, bem, qual método de replicação você deve usar.

E observe que você começa com algumas perguntas muito simples. Quantos dados posso usar? E se a resposta for zero, você sabe que somente no gráfico superior pode escolher a primeira ou a quarta linha. Então você faz outra pergunta. Bem, quanto tempo posso levar para a recuperação? E se alguém disser, bem, segundos ou minutos, isso fará escolhas para você. E então, o failover precisa ser automático ou exige que alguém o faça manualmente? E essa é outra questão de negócios. Eles podem dizer que o desejam automaticamente, porque não querem confiar em um procedimento de escalação e, em seguida, alguém recebe um ticket e resolve o problema. Eles só querem que seja corrigido.

Essas são questões de negócios e são as mesmas perguntas se eu fizer o mesmo para a Oracle. E pergunto: OK, que tipo de falha eu permito, que tipo de duração, o que posso perder, qual é o procedimento de recuperação? Essas são todas as opções de negócios; portanto, se a empresa me der as respostas para três ou quatro perguntas, meu trabalho é muito fácil, eu apenas entrei aqui, escolho o que for mais próximo e o construo. E lembre-se, na nuvem, pode haver apenas algumas caixas de seleção para implementá-las.

E com isso, isso me leva ao fim do meu material e ao tempo para abrir isso para perguntas.

Eric Kavanagh: Tudo bem, Dez, talvez você primeiro e depois Robin?

Dez Blanchfield: Absolutamente. Na verdade, provavelmente um pouco injusto para aqueles que não estão no Twitter, mas eu apenas twitei uma imagem de um gráfico que quero visualizar na mente de todos e, em seguida, quis fazer a pergunta ao nosso amigo aprendido na chamada aqui. Quando penso em código-fonte proprietário versus código-fonte aberto neste espaço - que geralmente é o que falamos, bancos de dados proprietários de empresas como Oracle e Microsoft e assim por diante - em relação ao código-fonte aberto -, você acaba com esse desafio em que o mundo proprietário o fornecedor de software de internet ou desenvolvedor de software ou a empresa investe nos órgãos para aumentar essa complexidade. E assim, você acaba com um cenário em que compra o software e não precisa investir em muitas pessoas porque está comprando a capacidade incorporada e em código aberto - você não paga pelo software ou é de baixo custo, digamos, mas você não paga pelo software, mas precisa investir nos órgãos.

E estou ansioso para ter seus pensamentos sobre o malabarismo, principalmente agora que estamos mudando para modelos de nuvem onde você pode obter um ou outro. Você pode acessar a AWS ou o Azure e seu Rackspace, qualquer que seja, e comprar como um serviço que fornece sua plataforma de banco de dados, ou pode fazê-lo através do código-fonte aberto. E sobre o que acabamos de falar, qual é o problema entre o código-fonte proprietário e o código-fonte aberto e como os padrões de design dos quais você está falando entram em vigor e quais são seus pensamentos gerais sobre esse tópico à medida que avançamos, principalmente quanto ao fornecimento de disponibilidade?

Bert Scalzo: Um dos grandes itens que encontro quando estou tentando responder a essa pergunta, volto ao cliente e pergunto sobre os requisitos de desempenho. E a razão pela qual faço isso é que descobri - pelo menos historicamente e em minha própria experiência - que, quando se trata de clientes que precisam de alto rendimento na replicação, quase sempre estou melhor com a replicação fornecida pelo banco de dados fornecedor, devido à natureza em que é incorporado mais inerentemente e em um nível mais baixo, e às vezes usa mecanismos que não estão disponíveis para o mundo externo, mesmo em uma solução de código aberto.

E vou dar um bom exemplo de um caso que tive. Eu tinha uma empresa baseada na Internet que estava usando o MySQL como banco de dados e eles estavam em uma versão antiga do MySQL, como a Versão 4.0, e a replicação entre os nós era o fator limitante do tamanho em que eles podiam escalar seus bancos de dados. E eles estavam pensando em comprar uma solução de terceiros, e depois em "Bem, talvez possamos usar uma das soluções de código aberto". E o que realmente se resumia era: tudo o que eles precisavam fazer era atualizar o MySQL para a versão, acho que foram 5, 5, porque a diferença entre essas duas versões de banco de dados estava na versão 4.0 da replicação do MySQL não era encadeada e na versão 5.0, era, e esse era realmente o melhor caminho para eles.

Agora, examinamos as outras opções, mas o fator decisivo foi o desempenho e a permanência na solução do fornecedor do banco de dados, e fazer a atualização do banco de dados acabou sendo nossa melhor solução para obter a maior probabilidade de obter o desempenho necessário. a maior disponibilidade.

Dez Blanchfield: Sim, isso reflete meu próprio pensamento, para ser honesto. Apenas para divulgação completa, e não vou entrar em marcas, mas sou de uma empresa proprietária trabalhando para OEMs e fornecedores de software e COIs em geral, e essa tem sido definitivamente minha experiência e, ao mesmo tempo, sou muito profissional. -open-source e sou colaborador de código para vários projetos que não mencionaremos, mas concordo com você em se você for uma organização grande - digamos que você seja um banco ou o que quer que seja invariavelmente você não quer ser uma loja de TI. Você sabe, por exemplo, se você é um editor de jornais ou um varejista, não quer ser uma loja de TI que publica jornais, mas sim uma loja de jornais que apenas aproveita a TI.

E assim, investir nos recursos proprietários nos quais os desenvolvedores de software constroem toda essa capacidade, no balanceamento de carga e assim por diante, na ferramenta, faz muito mais sentido do que se você é uma startup de pontocom ou algo assim assim que pode investir em corpos humanos. Onde você vê isso indo?

Provavelmente minha última pergunta antes de entregar ao Dr. Robin Bloor, porque sei que estamos com pouco tempo. Onde você vê isso indo do ponto de vista da tendência? Então, você está lá fora o tempo todo, está no limite das coisas, está vendo as pessoas se sentarem e prestarem atenção e acordarem com a necessidade de fazer disso uma parte comercial do dia-a-dia conversa do dia de volta à sala de diretoria? Ou você ainda está vendo a fazenda dos nerds, os técnicos e os capuzes pensando na disponibilidade, porque os faz acordar às quatro da manhã quando algo fica offline?

Você acha que a tendência está mudando agora para organizações de todos os tamanhos, não para as óbvias, como companhias aéreas, bancos e finanças, mas apenas para as empresas em geral? Você acha que as pessoas realmente ficaram sem proposta de valor para proteger seus ambientes de banco de dados e fornecer alta disponibilidade e investir nisso, ou você acha que ainda temos um caminho a percorrer? Qual é o sentido geral do mercado lá fora?

Bert Scalzo: No momento, acho que ainda existe uma lacuna, mas não porque a empresa não está solicitando, é uma lacuna nos níveis de comunicação entre os dois lados da cerca. Em outras palavras, as pessoas de negócios estão dizendo claramente: "Esses aplicativos exigem alta disponibilidade e têm esses requisitos específicos quando dizemos alta disponibilidade".

De uma forma ou de outra, essa mensagem não está sendo transmitida claramente ao pessoal da tecnologia. Ou o pessoal da tecnologia volta e diz: "Bem, isso é complicado e vai custar mais dinheiro", e isso, aquilo ou aquilo. Acho que o que vai acontecer é que finalmente vai se deteriorar porque, honestamente, por estar, por exemplo, na nuvem, basta marcar algumas caixas aqui ou ali para dizer: "Construa-me essa estrutura tecnológica realmente complexa" realmente não há uma boa razão para o pessoal de tecnologia voltar e dizer ao pessoal de negócios: "Oh, é caro" ou "É difícil de fazer" ou isto ou aquilo, e os empresários estão começando a saber que esse é o facto.

E eu já vi em ambientes onde, você sabe, o pessoal da equipe de TI veio e disse: “Ah, você não pode ter o que deseja. É muito caro. ”E eles contratarão uma empresa de consultoria terceirizada que dirá:“ Não, isso não está correto. Aqui está como você pode fazer isso. Aqui está o que vai custar. ”Então, acho que ainda temos um pouco de tempo entre os níveis de comunicação entre os dois lados antes que isso se torne automático.

Dez Blanchfield: Sim, isso definitivamente reflete o que eu vi aqui na Austrália e na Ásia-Pacífico. Tenho certeza que é uma coisa global. E é isso que muitos dos principais tomadores de decisão da sala de reuniões, todos os chefes de linha de negócios, são 'muito mais experientes em termos técnicos - estão lendo os blogs, assistindo a webinars, sintonizados em vários artigos e podcasts e estão participando de eventos, fóruns e reuniões, e agora conhecem suas opções e sabem que a nuvem é uma opção.

Eles também sabem que podem trazer isso, como você disse, a capacidade deles internamente, e então eu acho que há um desafio interessante agora, que a conversa deve acontecer, que é basicamente o que fizemos hoje onde as pessoas, meio que, comece a fazer as coisas internamente e faça apenas almoços marrons e faça um briefing interno sobre qual é o nosso estado atual, qual é o nosso estado ideal, para onde precisamos chegar? E então, meio que, junte isso.

Eu tinha uma mensagem privada na qual tocarei rapidamente agora. Alguém fez uma pergunta: “É realista que você obtenha 100% de disponibilidade?” E você pode me corrigir aqui, mas vou dizer que sim. Eu construí uma plataforma para transferência eletrônica de fundos, gateway EFTPOS entre plataformas bancárias rápidas e os terminais EFTPOS. Eu construí isso no início dos anos 2000. Na verdade, ele está online 100% do tempo há 17 anos. De fato, foi construído antes dos anos 2000, mas foi produzido apenas em 2000/2001.

Então, os 17 anos se passaram desde o desenvolvimento até os testes e depois entraram em produção. Nesses 17 anos, os PCs de commodities de muito baixo custo, executando um sistema operacional de código aberto, mas um banco de dados proprietário, realizam trocas ativas / passivas a cada 90 dias, com diferentes patentes de design sendo aplicadas, com replicação de discos em cada servidor, replicação de dados entre servidores modelo, replicação de vários datacenters e alternância do datacenter A realizando a produção por 90 dias e, em seguida, alternando para o datacenter B e realizando a produção.

E, ao contrário, ele corrige e atualiza automaticamente, de modo que apenas para a pergunta que acabei de receber em particular, sim, é possível, mas com muito investimento nesse projeto do ponto de vista do design. Portanto, a infraestrutura não era realmente tão cara, mas o design, os testes e a implementação eram muito caros para conseguir isso. Portanto, não tivemos que gastar muito dinheiro em hardware e infraestrutura, mas usamos ferramentas muito inteligentes, nos dias em que a nuvem não era sequer uma moeda.

Então, a resposta é sim, isso pode ser feito, ainda mais agora com a nuvem, como acabamos de ouvir, com o clique de um botão você pode ativar esse recurso. Vou jogar isso para Robin, porque tenho certeza de que ele também tem perguntas. Muito obrigado por responder minhas perguntas e eu realmente amei ouvir sua mensagem hoje. Completamente a bordo com tudo isso porque reflete tudo o que tenho feito nos últimos quase 30 anos.

Dr. Robin Bloor: Bem, ok, eu vou buscá-lo. Uma das coisas que me fascinou na sua apresentação foi o número de opções disponíveis agora que não estavam disponíveis quando eu costumava ter dificuldades com essas coisas. Estou meio interessado em quem vai projetar essas configurações ou quem hoje em dia projeta essas configurações? O que costumava acontecer, ou o mundo com o qual estou acostumado, é que haveria um sistema transacional bastante pesado e você estaria interessado em tempo de atividade alto e alta disponibilidade. Porque, você sabe, o sistema transacional, seria caro se fosse interrompido de alguma forma. E você não teria todas as opções que acabou de me apresentar, mas, de uma maneira ou de outra, você poderia encontrar uma maneira, principalmente através da replicação, de criar uma espera quente que não se encaixaria de maneira imperceptível, mas daria a você um serviço degradado até você voltar.

E eu estou meio que olhando o que você estava me mostrando e pensando sobre isso, sem ter feito esse tipo de trabalho de design há 15 anos, quem está fazendo esse trabalho agora? Isso é, como era no meu dia, algo que você fez no início de um projeto, você sabe, colocar a infraestrutura em funcionamento? Ou isso é algo que é uma atividade contínua dentro de uma organização? Porque existem novas opções de tecnologia.

Bert Scalzo: Nas grandes empresas que são muito eficientes e eficazes em todas as suas operações, incluindo a TI, elas normalmente têm um grupo de arquitetura centralizada ou têm algum nome para isso, ouvi dizer que grupo de arquitetura ”muitas vezes. E será responsabilidade deles conhecer todas essas fotos diferentes, quais são os prós e os contras e quais são os custos. E o que acontecerá é que, quando um aplicativo específico estiver olhando e disser: "Ei, eu tenho que atender aos requisitos de negócios X, Y e Z. Ei, equipe de arquitetura, quais são minhas escolhas?"

Eles darão a resposta, como, aqui estão os dois ou três que estão disponíveis e, nesse momento, a decisão retornará ao nível mais baixo da equipe do aplicativo ou do patrocinador comercial do aplicativo. Mas, tipicamente, há um grupo centralizado que fica em cima disso e tem essas informações prontas e pré-construídas.

Agora, são as empresas de médio porte que não são tão formais. O que tende a acontecer é que você receberá um ou dois de seus DBAs ou administradores de sistemas e eles informalmente serão citados como "o especialista em domínio" para esse tipo de conhecimento. Assim, mesmo nas empresas de médio porte, isso acontece apenas em uma estrutura não formalizada.

Dr. Robin Bloor: Isso é realmente interessante. Na minha época, nunca estaríamos pensando em alta disponibilidade, exceto nos sistemas transacionais. Hoje em dia, é claro que você tem sistemas de streaming que provavelmente estão sujeitos a demandas ainda maiores em termos de disponibilidade. Mas, no ambiente baseado em consulta, back-end, analítica, data warehouse, tipo de ambiente DI, você já vê requisitos de alta disponibilidade lá?

Bert Scalzo: Sim, e estou feliz que você fez essa pergunta. Eu trabalhei para uma empresa de varejo e suas decisões estratégicas para os negócios foram baseadas em grande parte da análise que eles faziam no data warehouse. E, de fato, eles foram entrevistados pela Revista Forbes e o CEO da empresa disse: “Ei, o preço das nossas ações aumentou 250% nos últimos cinco anos e uma razão muito grande para que isso aconteça é porque sabemos como alavancar efetivamente nossos dados em nosso data warehouse. ”Eles eram tão bons em tomar decisões de negócios que, para eles, o data warehouse e a capacidade de fazer essas análises, poder tomar decisões diariamente com base nos dados operacionais, era, para eles, um sistema de produção.

E vou dar um bom exemplo de quão importante é. Com esse fornecedor de varejo em particular, o responsável pelas vendas de cerveja, ele foi o terceiro executivo mais importante da empresa, porque ele trouxe, você sabe, 60 a 70% da receita. E assim, ele precisava ser capaz de, para permanecer competitivo nesse mercado, ele precisava saber todos os dias, você sabe, quais promoções eu deveria estar realizando. E isso pode se basear, sabe, não apenas na época do ano, mas também no clima, nos padrões e em outros dados críticos que podem afetar a venda de algo como cerveja.

Dr. Robin Bloor: Bem, acho que deve haver coisas assim. Estamos meio que sem tempo, acho que devo entregar a Eric, caso ele tenha algumas perguntas da platéia. Eric?

Eric Kavanagh: Sim, tudo isso foi ótimo, Bert. Acho que você abordou todas as perguntas que tivemos da platéia em sua apresentação. Mas é divertido de assistir. Estou feliz por você ter falado sobre virtualização de armazenamento e quanto impacto isso pode ter. Então, isso é tudo de bom.

Bem, pessoal, arquivamos todos esses webcasts para visualização posterior. Então, entre on-line no Techopedia.com para procurar a seção de webcast. Todos os Hot Techs serão listados lá. Um grande obrigado ao nosso amigo Bert por sua experiência. E, claro, para Dez e Robin. E com isso vamos despedir vocês, pessoal. Cuidar. Falaremos com você na próxima vez. Tchau tchau.

Proteja seu banco de dados: alta disponibilidade para dados de alta demanda