Por Techopedia Staff, 25 de agosto de 2016
Resumo : A anfitriã Rebecca Jozwiak discute o fenômeno da análise incorporada e dos cientistas de dados do cidadão com o Dr. Robin Bloor, Dez Blanchfield e David Sweenor.
Você deve se registrar neste evento para ver o vídeo. Registre-se para ver o vídeo.
Rebecca Jozwiak: Senhoras e senhores, olá e bem-vindos à Hot Technologies. "Incorporar todos os lugares: capacitando o cientista de dados do cidadão" é o nosso tópico hoje. Estou substituindo seu anfitrião habitual, esta é Rebecca Jozwiak substituindo Eric Kavanagh. Sim, este ano é quente. Particularmente, o termo "cientista de dados" tem recebido muita atenção, embora costumávamos chamá-los de nomes chatos como "estatístico" ou "especialista em análise", abordando praticamente o mesmo tipo de atividades, mas tem um novo nome sexy e é ganhando muita atenção. Eles são altamente desejáveis de ter no local de trabalho, benéficos para a organização e todos querem um. Mas eles são: 1) caros, 2) difíceis de encontrar. Você sabe, foram publicadas todas as notícias sobre a escassez de habilidades dos cientistas de dados, sim, mas ainda assim oferecem um valor tremendo à organização e as pessoas estão meio que clamando para descobrir como obter esse valor sem ter que perder o dinheiro. falar.
Mas a boa notícia é que estamos vendo ferramentas e softwares surgindo para compensar essa falta. Temos automação, aprendizado de máquina, análise incorporada, que é sobre o que vamos aprender hoje e meio que deu origem a esse novo termo, "o cientista de dados do cidadão", e o que isso significa? Não, ele não é um cientista de dados treinado, pode ser seu usuário de negócios, seu especialista em BI, alguém de TI, alguém que possui o histórico, mas talvez não necessariamente o conhecimento. Mas o que faz, essas ferramentas e o software, é dar a mais pessoas acesso a essas soluções inteligentes, mesmo que elas não conheçam a codificação profunda. Mas isso apenas ajuda a melhorar o desempenho geral quando você dá a todos um pouco mais de acesso a esse pensamento analítico. Você não precisa ter o treinamento necessariamente para ter o tipo de curiosidade que pode levar a boas idéias para sua empresa.
Discutindo isso hoje conosco está o nosso próprio Robin Bloor, analista-chefe do Bloor Group, um dos próprios cientistas de dados indescritíveis, Dez Blanchfield ligando, e temos David Sweenor, da Dell Statistica, nos apresentando hoje. E com isso vou passar para Robin Bloor.
Robin Boor: Ok, obrigado por essa introdução. Eu meio que pensei sobre isso em um contexto histórico. O que estamos vendo aqui é um dos desenhos de Leonardo da Vinci para um tipo de planador que um homem poderia colocar nas costas. Não tenho idéia se isso realmente funcionaria. Eu não entraria nisso, tenho que dizer. No entanto, da Vinci, sempre que penso em da Vinci, penso nele como uma das pessoas mais curiosas e analíticas que já existiram. E é bem claro se você apenas olhar para o planador que ele foi projetado com base na asa de um pássaro e ele, de uma maneira ou de outra, estudou os vôos dos pássaros para construí-lo.
Se adotarmos a perspectiva histórica - analisei isso de fato - a análise talvez seja a aplicação mais antiga da matemática. Há censos que datam pelo menos dos tempos da Babilônia. Sabemos disso porque existem basicamente alguns comprimidos cuneiformes que contêm dados como esses. Não se sabe se havia algo que voltou mais cedo. Mas o óbvio é que você tem uma civilização com uma grande população de pessoas; na verdade, exige planejamento e vale a pena saber o que você está planejando e quais são os requisitos dessas pessoas.
E foi assim que começou e também onde a computação começou porque os primeiros computadores, os primeiros computadores mecânicos, eram, na verdade, acho que o primeiro foi o censo criado por Hollerith, que se tornou IBM, acredito. Tudo isso avançou. Houve algum tipo de interlúdio entre talvez a década de 1970 e os dias atuais, onde há um grande número de outras aplicações e análises, você poderia dizer, que ficaram em segundo plano. Sim, havia análises em andamento - isso estava acontecendo em grandes organizações, particularmente bancos e companhias de seguros, e na General Electric e empresas de telecomunicações e coisas assim - mas não era geralmente usado em todos os negócios e agora está começando a ser usado em geral o negócio. E mudou o jogo, realmente. A primeira coisa que pensei em chamar a atenção é a pirâmide de dados, da qual gosto particularmente. Quero dizer, eu desenhei um desses 20 anos atrás - pelo menos 20 anos atrás - para tentar entender, realmente, na época, eu estava tentando entender BI e algumas das primeiras minerações de dados que estavam sendo feitas. O que defini aqui é a ideia de dados e os exemplos são sinais, medições, gravações, eventos, transações, cálculos, agregações, pontos de informação individuais. Você pode pensar nelas como moléculas de informação, mas são pontos individuais. Torna-se informação assim que obtém contexto. Dados vinculados, dados estruturados, bancos de dados, visualização de dados, plotadoras, esquemas e ontologias - todos eles se qualificam em minha mente como informações, porque o que você fez é agregar muita variedade e criar algo muito mais que um ponto de dados, algo que realmente tem uma forma, uma forma matemática.
Acima disso, temos conhecimento. Examinando as informações, podemos aprender que existem vários padrões e podemos aproveitá-los através da formulação de regras, políticas, diretrizes, procedimentos e, então, assume a forma de conhecimento. E praticamente todos os programas de computador, o que quer que estejam fazendo, são de algum tipo, porque estão trabalhando contra dados e aplicando regras a eles. Temos essas três camadas e há um refinamento crescente que ocorre entre as camadas. E, no lado esquerdo deste diagrama, são mostrados novos dados sendo inseridos, portanto muitas dessas coisas são estáticas. Os dados estão se acumulando, as informações estão se acumulando e o conhecimento está potencialmente aumentando. No topo, temos “Compreensão” e eu manteria, embora seja um argumento filosófico, que a compreensão reside apenas nos seres humanos. Se eu estiver errado sobre isso, todos nós seremos substituídos por computadores em algum momento. Mas, em vez de ter o debate, passarei ao próximo slide.
Quando olhei para isso, o interessante, isso é algo recente, o interessante foi tentar descobrir o que a análise realmente era. E, finalmente, desenhando vários diagramas e terminando com um que se parecia com isso, cheguei à conclusão de que, de fato, o desenvolvimento de análises é realmente apenas desenvolvimento de software com uma quantidade terrível de fórmulas matemáticas. A exploração analítica é um pouco diferente do desenvolvimento de software, no sentido de que você realmente pegaria muitos modelos diferentes e os investigaria para gerar novos conhecimentos sobre os dados. Mas uma vez que você o gerou, ele é implementado no que eu considero como suporte passivo à decisão, que são informações que apenas são fornecidas ao usuário; suporte interativo à decisão, como OLAP, em que o usuário recebe um conjunto estruturado de dados para investigar e deduzir as coisas por conta própria, usando as várias ferramentas disponíveis. Muita visualização é assim. E então temos automação, se você pode transformar algumas idéias analíticas reunidas em um conjunto de regras que podem ser implementadas, não precisa necessariamente que um ser humano esteja envolvido. Foi assim que eu olhei quando fiz tudo isso. E várias coisas começaram a me ocorrer. Uma vez que uma área de atividade, digamos, uma vez que um domínio de dados seja realmente minado, minado, explorado minuciosamente em todas as direções possíveis, eventualmente ele se tornará um BI cristalizado. O conhecimento inventado começa a se tornar um conhecimento que informa vários usuários de várias maneiras e aumenta sua capacidade, esperançosamente, de realmente fazer o trabalho que eles fazem.
Uma das coisas que notei e analisei a análise preditiva por cerca de cinco anos, mas a análise preditiva está se tornando BI, no sentido de que está apenas se transformando em informações úteis para alimentar as pessoas e, como já mostrei, há relatórios automatizados de BI, BI exploratório, BI, gradações muito diferentes e análises preditivas estão indo nas três direções. E o processo analítico, como apontei, não é tão diferente do desenvolvimento de software, apenas feito por pessoas diferentes com habilidades um pouco diferentes. Suponho que devo enfatizar que as habilidades necessárias para criar um cientista de dados realmente bom levam anos para serem adquiridas. Eles não são adquiridos com facilidade e nem um grande número de pessoas pode fazê-lo, mas isso envolve a compreensão da matemática em um nível muito sofisticado para saber o que é válido e o que não é válido. Desenvolvimentos de análise, descoberta de novos conhecimentos, implantação de análises, trata-se de tornar o conhecimento operacional. Esse é o tipo de cenário que vejo em toda a análise. É uma área enorme e há muitas, muitas dimensões, mas acho que a generalização se aplica a tudo.
Depois, há a interrupção dos negócios, como mencionei, existem várias organizações, as empresas farmacêuticas são outra, que têm em seu DNA que têm análises. Mas existem muitas organizações que realmente não têm isso em seu DNA, e agora elas têm a capacidade, agora o software e o hardware são muito mais baratos do que costumavam ser, agora eles têm a capacidade de explorá-la. Eu diria várias coisas. A primeira coisa é que a análise é, em muitos casos, a pesquisa e o desenvolvimento. Você pode estar apenas aplicando análises em uma área específica da organização e pode parecer banal que, de uma maneira ou de outra, esteja analisando os pedidos dos clientes novamente de várias perspectivas, juntando-os a outros dados. Mas a análise realmente cria a possibilidade de olhar para a organização como um todo e de analisar praticamente qualquer atividade específica que está ocorrendo dentro da organização e em toda a cadeia de atividades. Mas uma vez que você realmente se muda para essa área, eu diria que é pesquisa e desenvolvimento. E há uma pergunta que me foi feita algumas vezes, que é: "Quanto uma empresa deve gastar em análise?" E acho que a melhor maneira de pensar em fornecer uma resposta é pensar em análise como P&D e pergunte: "Quanto você gastaria em pesquisa e desenvolvimento na área de eficiência dos negócios?"
E os negócios que não são analíticos, há muitas coisas que eles não sabem. Primeiro de tudo, eles não sabem como fazê-lo. Normalmente, se eles estão realmente adotando uma análise ou outra dentro da organização - eles realmente não têm outra opção a não ser procurar uma consultoria que possa ajudá-los a fazer isso porque, seria impossível ou muito difícil para a maioria empresas para contratar um cientista de dados, encontrar um, pagar por um e realmente confiar neles para fazer o que você quer que eles façam. Muito difícil. A maioria das empresas não sabe como contratar ou educar funcionários para realmente fazer esse trabalho, e a razão para isso é simplesmente que ainda não está em seu DNA, portanto não faz parte de seus processos comerciais naturais. Isso alimenta o próximo ponto. Eles não sabem como torná-lo um processo de negócios. A melhor maneira de fazer isso, a propósito, é copiar o que as empresas farmacêuticas e as seguradoras apenas visualizam, e algumas empresas do centro de saúde, apenas olham a maneira como elas usam as análises e as copiam. Porque é um processo de negócios. Não sei como policiar ou auditar. Isso realmente, especialmente agora que muitas empresas de software criaram produtos que automatizam uma enorme quantidade de análises. O ponto sobre auditoria é importante, quando você tem uma consultoria ou alguém no local confiável para entender quais são os resultados de qualquer cálculo analítico, esse é o tipo de escolha que você deve fazer, mas se você colocar ferramentas analíticas realmente poderosas nas mãos de pessoas que não entendem adequadamente a análise, é provável que cheguem a conclusões que podem não estar corretas. E como eu disse, as empresas não sabem como fazer o orçamento para isso.
Esses são os sabores da analítica, eu irei analisá-los. A análise estatística e a modelagem estatística são significativamente diferentes das análises preditivas, a maioria das quais, a propósito, é ajustada a curvas. O aprendizado de máquina é diferente daquelas coisas, análise de caminho e séries temporais, que são basicamente feitas em fluxos de status, são diferentes novamente. A análise de gráficos é diferente novamente, e a análise de texto e a análise semântica são diferentes novamente. Isso apenas indica que isso é uma coisa de vários gêneros. Não é, você não começa a analisar, começa a analisar os problemas que você tem e procura as várias ferramentas e os vários tipos de análise que serão adequados a eles. E, finalmente, a rede líquida. Por causa da evolução de hardware e software, na minha opinião, a análise está em sua infância. Ainda há muito, muito mais por vir e veremos isso acontecer nos próximos anos. Acho que posso passar a bola para Dez agora.
Dez Blanchfield: Sim, fale sobre um ato difícil a seguir, Robin. Vou visitar este tópico brevemente de um dos meus ângulos favoritos, que é o ângulo do humano. Há tantas mudanças acontecendo em nossas vidas cotidianas. Uma das maiores perturbações do dia a dia, atualmente, a meu ver, é apenas o trabalho diário. Aparecer no trabalho e tentar fazer o trabalho para o qual foi contratado, e a expectativa crescente de passar de uma pessoa comum para um super-herói e a quantidade de informações que circulam pelas organizações e emitem muito, muito rapidamente, é um desafio significativo e cada vez mais precisamos fornecer ferramentas cada vez melhores para as pessoas tentarem lidar com o fluxo de conhecimento e informações, então pensei em tentar abordar isso de um ângulo um pouco divertido . Mas sempre me parece que temos essa mente alta ou flash mobs e assim por diante, que meio que nos levam ao que chamamos de análise, mas realmente o que estamos falando é disponibilizar informações para as pessoas, e permitindo que eles interajam com ele e o façam de maneira que seja natural e pareça normal.
E, na verdade, isso me lembra um vídeo do YouTube de uma criança pequena, bebê, sentada no chão e sentada ali, brincando com um iPad e batendo palmas, beliscando e espremendo e movendo as imagens e brincando com a tela, os dados lá. E então o pai tira o iPad e coloca uma revista, uma revista impressa no colo da criança. E essa criança provavelmente não tem mais de dois anos. A criança começa a tentar passar o dedo na tela da revista, apertar e apertar e a revista não responde. A criança levanta o dedo, olha para ele e pensa: “Hum, acho que meu dedo não está funcionando”, e se cutuca no braço e pensa: “Ah, não, meu dedo está trabalhando, posso sentir meu braço e aquilo. parece bom ”, e mexe o dedo, e o dedo se mexe e responde. Sim. Em seguida, ele tenta interagir com a revista novamente, e baixo e eis que não aperta, aperta e rola. Depois eles tiram a revista e colocam o iPad de volta no colo, e de repente a coisa funciona. E aqui está um bebê que foi treinado para usar uma ferramenta analítica ou uma ferramenta de transmissão ao vivo para entretenimento e não sabe como a revista deve funcionar e como virar as páginas.
E esse é um conceito interessante por si só. Mas quando penso no conhecimento que circula nas organizações e na maneira como os dados fluem e na maneira como as pessoas se comportam, penso frequentemente nesse conceito do que as pessoas aprenderam a ser uma multidão instantânea, que é um evento onde e quais mídias sociais fazem isso é ainda mais fácil de se fazer, uma ideia como essa que é ir a este lugar nessa hora e data e ação, ou gravar vídeo e aprender essas danças, ou usar esse chapéu colorido e apontar para o norte à uma hora. E você expande isso através da sua rede e, invariavelmente, um monte de pessoas, centenas delas, aparecem no mesmo lugar ao mesmo tempo e fazem a mesma coisa, e há esse fator uau, como, “Vaca sagrada, isso foi realmente impressionante! ”Mas, na verdade, é uma idéia muito simples, e um conceito simples acaba sendo divulgado em nossas redes e obtemos esse resultado que é uma coisa visualmente impressionante e audivelmente impressionante. E quando você pensa em uma organização, a maneira como queremos que as pessoas se comportem e como lidam com sistemas de informação e clientes, muitas vezes é simples assim, é uma ideia ou um conceito ou uma característica cultural ou comportamental que tentamos transmitir através e capacitar com ferramentas e informações.
E sustentando tudo o que é esse mantra que tenho há mais de duas décadas e meia, ou seja, se sua equipe não consegue encontrar o que precisa para fazer seu trabalho, sejam ferramentas ou informações, invariavelmente eles reinventam a roda. E esse é um desafio cada vez maior agora, onde temos muito conhecimento, muita informação e coisas se movendo muito rapidamente, que queremos impedir que as pessoas reinventem a roda. E quando pensamos em nosso ambiente de trabalho, voltando ao ponto de vista das pessoas, que é um dos meus favoritos, fiquei surpreso quando ficamos surpresos que os cubículos não eram um ambiente propício para bons resultados, ou alinhamos coisas como essa horríveis fotos aqui, e não mudou muito, apenas abaixou as paredes e as chamou de espaços de trabalho abertos. Mas no meio, com o laço amarelo ao seu redor, há duas pessoas trocando conhecimento. E, no entanto, se você olhar para o resto da sala, todos estão sentados lá, obedientemente, batendo ali, colocando informações em uma tela. E, na maioria das vezes, não trocando conhecimento e dados, e há várias razões para isso. Mas na interação no meio do andar, à esquerda, no círculo amarelo, há duas pessoas conversando lá fora, trocando conhecimento e provavelmente tentando encontrar algo, tentando dizer: “Você sabe onde está este relatório, onde eu pode encontrar esses dados, que ferramenta eu uso para fazer isso? ”E provavelmente não funcionou, então eles não têm nada e andaram pelo chão, quebraram a regra do espaço do escritório do cubículo e o fizeram pessoalmente.
E tivemos ambientes semelhantes no escritório em que brincamos de brincadeira, mas a realidade é que eles são bastante poderosos e eficazes. E uma das minhas favoritas é a plataforma de análise móvel ou fixa chamada de bebedouro, onde as pessoas chegam lá e conversam por aí e trocam conhecimentos, comparam idéias e executam análises enquanto estão no bebedouro, trocando idéias. São conceitos muito poderosos quando você pensa sobre eles. E se você pode traduzi-los para seus sistemas e ferramentas, obtém um resultado incrível. E temos o favorito de todos os tempos, que é essencialmente o mais poderoso hub de distribuição de dados do escritório, também conhecido como recepção. E se você não consegue encontrar algo, para onde você vai? Bem, você caminha até a frente do escritório e vai à recepção e diz: "Você sabe onde é x, y, z?". E ouso alguém me dizer que não fez isso pelo menos uma vez em uma nova loja. emprego ou em um momento em que eles simplesmente não conseguem encontrar algo. E você tem que se perguntar: por que é que isso acontece? Deve estar em algum lugar na intranet ou em alguma ferramenta ou qualquer outra coisa. Deve ser fácil de encontrar.
Então, quando se trata de dados e análises e das ferramentas que fornecemos à nossa equipe para fazer o trabalho deles e a maneira como os humanos interagem com os trabalhos, tenho a opinião de que, antes do recente surgimento de ferramentas de análise e plataformas de big data, ou "processamento de dados", como também chamamos na velha escola, o compartilhamento de relatórios e conhecimento estava longe de ser dinâmico, colaborativo ou aberto. Quando você pensa sobre o tipo de sistema com o qual esperamos que as pessoas façam seu trabalho, tínhamos um clássico: as pessoas chamam de legado agora, mas a realidade é que é apenas o legado que ainda existe e ainda está aqui hoje e, portanto, não é realmente legado. Mas os sistemas tradicionais de RH e sistemas ERP - gerenciamento de recursos humanos, planejamento de recursos empresariais, gerenciamento de dados corporativos e sistemas que usamos para gerenciar as informações para administrar uma empresa. Invariavelmente, está isolado. E desde o topo, plataformas simples como intranets departamentais, tentando se comunicar onde estão as coisas e como obtê-las e como interagir com o conhecimento em todo o lugar. Nós mostramos isso na nossa intranet. É tão bom quanto as pessoas que dedicam tempo e esforço para colocar isso lá em cima, caso contrário, isso fica na sua cabeça. Ou você tem dados localizados na parte inferior da cadeia alimentar, nas SANs corporativas e tudo mais, por isso as redes de área de armazenamento estão cheias de arquivos e dados, mas quem sabe onde encontrá-los.
Na maioria das vezes, criamos essas plataformas ou sistemas fechados de dados e, portanto, as pessoas voltaram a gostar de planilhas e PowerPoints para passar informações por todo o local. Mas havia uma coisa interessante que aconteceu recentemente, na minha opinião, e que os dispositivos móveis e a Internet em geral funcionam de acordo com a ideia de que as coisas poderiam realmente ser melhores. E predominantemente no espaço do consumidor. E é uma coisa interessante que na vida cotidiana começamos a ter coisas como internet banking. Não precisávamos ir a um banco fisicamente para interagir com eles; poderíamos fazê-lo por telefone. Originalmente isso era desajeitado, mas a internet apareceu e tínhamos um site. Você sabe, e quantas vezes você esteve no seu banco recentemente? Na verdade, eu não posso, tive uma conversa sobre isso outro dia, e na verdade não me lembro da última vez que fui ao meu banco, pelo que fiquei bastante chocado, pensei que deveria ser capaz de me lembrar disso, mas foi tão longo atrás, na verdade, não me lembro quando fui para lá. E agora temos esses aparelhos em nossas mãos na forma de celulares e telefones, tablets e laptops, temos redes e acesso a ferramentas e sistemas, e o espaço do consumidor que aprendemos que as coisas podem ser melhores, mas porque da rápida mudança no espaço do consumidor, que foi uma mudança mais letárgica e glacial dentro da empresa e dos ambientes, nem sempre levamos essa mudança para a vida profissional cotidiana.
E adoro zombar do fato de que você não pode transmitir dados de transmissão ao vivo para uma cópia impressa. Nesta imagem, há uma pessoa sentada olhando para algumas análises que foram realizadas, e há um belo gráfico produzido por alguém que provavelmente está pagando muito dinheiro como estatístico ou atuário, e está sentado tentando fazer análises em uma cópia impressa e cutucando-a. Mas aqui está a coisa assustadora para mim: essas pessoas nesta sala de reuniões, por exemplo, e eu vou usar isso como exemplo, estão interagindo com dados que agora são históricos. E é tão antigo de quando essa coisa foi produzida e impressa, então talvez seja um relatório de uma semana. Agora eles estão tomando decisões não tanto com dados ruins, mas com dados antigos, que invariavelmente podem ser dados ruins. Hoje eles estão tomando uma decisão com base em algo histórico, que é um lugar muito ruim para se estar. Conseguimos substituir essa cópia impressa por tablets e telefones, porque trabalhamos muito rapidamente no espaço do consumidor, e agora trabalhamos no espaço corporativo, que tempo real é insights e valor em tempo real.
E estamos ficando cada vez melhores nisso. E isso me leva ao ponto que Robin mencionou anteriormente, que era o conceito do cientista de dados do cidadão e a unidade desse conceito. Para mim, um cientista de dados cidadão é apenas pessoas comuns com as ferramentas e informações corretas, como iPads. Eles não precisam fazer as contas, não precisam conhecer os algoritmos, não precisam aplicar os algoritmos e reger os dados, precisam saber como usar a interface. E isso me traz de volta à minha introdução e ao conceito de criança sentada ali com um iPad versus uma revista, versus um iPad. A criança pode aprender de maneira muito rápida e intuitiva como usar a interface de um iPad para mergulhar nas informações e interagir com elas, embora talvez seja um jogo, uma mídia de streaming ou um vídeo. Mas não foi possível obter a mesma resposta ou interação de uma barra de revista e apenas piscar página após página, o que não é muito interessante, principalmente se você é uma criança que cresceu com iPads. Invariavelmente, os seres humanos podem olhar e aprender muito rapidamente como conduzir ferramentas e coisas que, se apenas lhes fornecermos, e se fornecermos uma interface como dispositivos móveis e particularmente tablets e smartphones com telas grandes o suficiente, e principalmente se você puder interagir eles no toque, com movimentos dos dedos, de repente você obtém esse conceito de cientista de dados cidadão.
Alguém que pode aplicar a ciência de dados com as ferramentas certas, mas sem realmente precisar saber como fazê-lo. E, na minha opinião, muito disso, como eu disse, foi impulsionado pela influência do consumidor, que se moveu e se transformou em demanda e empresa. Alguns exemplos realmente rápidos. Muitos de nós começamos a fazer coisas com nossos blogs e sites, como colocar pequenos anúncios ou olhar para rastreamento e movimento, usamos ferramentas como o Google Analytics e fomos alertados para o fato de que em nossos blogs e pequenos sites, poderíamos inserir pequenos pedaços de código e o Google nos forneceria informações em tempo real sobre quem está visitando o site, quando, onde e como. E em tempo real, conseguimos ver as pessoas acessando o site, navegando pelas páginas e desaparecendo. E foi bastante surpreendente. Ainda adoro fazer isso. Quando tento explicar as análises em tempo real para as pessoas, eu mostro a elas apenas um site com o Google Analytics conectado e, na verdade, vejo a interação ao vivo com as pessoas acessando sites e pergunto: "Imagine se você teve esses tipos de insights sobre seus negócios em tempo real. "
Tomemos um exemplo de varejo e, talvez, um farmacêutico, acho que você o chama de uma farmácia nos Estados Unidos, uma farmácia onde você entra e compra de tudo, desde comprimidos para dor de cabeça até protetor solar e chapéus. Tentar administrar essa organização sem informações em tempo real é um conceito assustador agora que sabemos o que sabemos. Por exemplo, você pode medir o tráfego de pedestres, colocar dispositivos na loja com uma carinha sorridente em um lado da tela porque está feliz, e um vermelho infeliz na extrema direita e algumas tonalidades diferentes no meio. Hoje em dia, existe uma plataforma chamada "Feliz ou não", em que você entra em uma loja e pode bater um rosto feliz ou um rosto triste, dependendo do feedback do cliente ao vivo. E isso pode ser interativo em tempo real. Você pode obter preços baseados na demanda ao vivo. Se houver muitas pessoas lá dentro, você poderá aumentar um pouco os preços e fazer a disponibilidade de estoque e informar as pessoas, por exemplo - as companhias aéreas, por exemplo, dirão às pessoas quantos assentos estão disponíveis agora no site quando você está reservando um voo, você não apenas disca aleatoriamente e espera poder aparecer e pegar um voo. Dados de RH ao vivo, você pode saber quando as pessoas estão ligando e desligando. Compras, se você estiver comprando e tiver dados ao vivo, poderá fazer coisas como esperar por uma hora e se proteger contra o preço do dólar americano para comprar sua próxima carga de estoque e fazer com que muitas coisas apareçam.
Quando mostro às pessoas o Google Analytics e transmito esse tipo de anedota, esse momento eureka, esse momento do “a-ha!”, Essa lâmpada se apaga em sua mente como: “Hmm, eu posso ver muitos lugares onde eu poderia fazer isso . Se ao menos eu tivesse as ferramentas e se tivesse acesso a esse conhecimento. ”E estamos vendo isso agora nas mídias sociais. Qualquer pessoa que seja um usuário experiente de mídia social, além de apenas mostrar fotos do café da manhã, tende a ver quantas curtidas estão recebendo, quanto tráfego está recebendo e quantos amigos estão recebendo, e fazem isso com o gosta, digamos, do Twitter como uma ferramenta de análise. Você pode acessar o Twitter.com para usar a ferramenta, mas digita no Google Twitter Analytics pontocom, ou clica no botão superior direito, abre o menu e faz isso, você obtém esses gráficos bonitos e ao vivo que indicam quantos tweets que você está fazendo e quantas interações com eles. E análises em tempo real apenas nas suas mídias sociais pessoais. Imagine se tivéssemos gostos do Google Analytics e Facebook e LinkedIn e Twitter, estatísticas do eBay chegando até você, mas em seu ambiente de trabalho.
Agora que temos o tipo de Web e dispositivos móveis ao alcance de nossas mãos, ele se torna um conceito de poder. E isso me leva à minha conclusão, e é que, invariavelmente, descobri que as organizações que utilizam ferramentas e tecnologia cedo, elas obtêm uma vantagem tão significativa sobre seus concorrentes que os concorrentes podem nunca alcançar. E estamos vendo isso agora com o conflito do cientista de dados do cidadão. Se pudermos levar as pessoas com as habilidades, o conhecimento para o qual as contratamos, e podemos fornecer as ferramentas certas, particularmente a capacidade de ver os dados em tempo real e descobrir dados e saber onde eles estão sem ter que andar pelos cubículos e faça perguntas em voz alta, tendo que ir e ficar no refrigerador de água para fazer algumas análises comparativas com as pessoas ou ir e perguntar à recepção onde está o índice. Se eles podem fazer isso na ponta dos dedos e podem levá-lo às suas reuniões com eles e sentar em uma sala de reuniões folheando as telas em tempo real, em vez de em cópia impressa, de repente empoderamos nossa equipe que não precisa ser real cientistas de dados, mas para realmente usar a ciência de dados e gerar resultados surpreendentes para as organizações. E acho que esse ponto de inflexão na qual passamos agora, onde o consumidor é direcionado para a empresa, o desafio é como fornecemos essa empresa e esse é o tema que acho da discussão de hoje. E com isso, vou embrulhar minha peça e entregá-la para ouvir como podemos resolver isso. David, até você.
David Sweenor: Tudo bem, muito obrigado pessoal, e obrigado Robin. Você sabe, Robin, concordo com sua avaliação original. Processo analítico, não é realmente diferente do que o desenvolvimento de software. Eu acho que o desafio dentro de uma organização é realmente, você sabe, talvez as coisas não estejam tão bem definidas, talvez haja um componente exploratório e um componente criativo. E Dez, você sabe, eu concordo com você, há muito reinventando a roda, e você sabe, não há uma organização em que eu entre hoje, você pergunta, bem, por que você está fazendo assim? Por que os negócios funcionam dessa maneira? E é fácil questionar e, muitas vezes, quando você está dentro de uma organização, é difícil mudar. Eu amo a analogia, a consumização das coisas. E não é mais assim quando vou ao aeroporto e quero trocar de lugar - faço no meu celular. Não preciso ir até o agente no estande e assistir esse agente digitar algo em um monitor monocromático por 15 minutos para alterar minha designação de assento. Eu prefiro fazê-lo no meu telefone, e é um desenvolvimento interessante.
Hoje, vamos falar um pouco sobre inteligência coletiva. Para aqueles que não sabem, o Statistica é uma plataforma de análise de ponta, que existe há mais de 30 anos. Se você olhar para alguma das publicações existentes no setor de analistas, ela sempre aparece como um dos pacotes de software de análise avançada mais intuitivos e fáceis de usar. Então, passamos os últimos anos trabalhando em um conceito chamado inteligência coletiva, e estamos levando-o para o próximo nível. Eu queria iniciar essa conversa com: como o trabalho é feito em sua organização?
E há duas imagens aqui. A da esquerda é uma imagem da década de 1960, e eu não comecei minha carreira na década de 1960, mas a imagem da direita é - é uma fábrica de semicondutores onde comecei a trabalhar. E eu trabalhei naquele prédio preto, telhado preto no canto superior esquerdo. Mas eles fizeram coisas semicondutoras. Esta é uma imagem recente do Google Images. Mas quando você volta para a imagem da década de 1960 à esquerda, é muito interessante. Você tem essas pessoas sentadas em uma fila e elas estão fazendo, você sabe, circuitos integrados e semicondutores. Mas há uma padronização, existe uma maneira padrão de fazer as coisas e houve um processo bem definido. Você sabe, talvez porque todas essas pessoas estejam sentadas em um ambiente aberto, talvez tenha havido alguma colaboração. Acho que perdemos um pouco disso na força de trabalho do conhecimento.
Quando me sentei naquele prédio no canto superior esquerdo, se eu quisesse colaborar com alguém, não estava aberto. Havia esses escritórios, talvez parte da equipe fosse remota ou talvez eu tivesse que atravessar o campus; era uma caminhada de 25 minutos, e eu teria que ir falar com alguém no prédio na extrema direita. Eu acho que perdemos algo ao longo do caminho. E então, você sabe, eu tive o mesmo pensamento: por que as pessoas - quantas pessoas continuam reinventando a roda dentro da sua organização? Acho que as organizações como um todo fizeram um bom trabalho nas décadas de 1990 e 2000 com CRM e data warehousing e, até certo ponto, com BI. Por alguma razão, a análise ficou um pouco atrasada. Houve investimentos significativos em data warehousing, padronização e normalização de dados, tudo isso e CRM, mas a análise ficou para trás por algum motivo. E eu estou me perguntando o porquê. Talvez haja um criativo - talvez seu processo não esteja bem definido, talvez você não saiba qual decisão ou alavanca está tentando mudar, sabe, em seus negócios, para mudar as coisas. Quando entramos nas organizações hoje, muitas pessoas fazem as coisas muito manualmente em planilhas.
E você sabe, eu olhei para uma estatística esta manhã, acho que diz que 80, 90% das planilhas têm erros, e algumas delas podem ser muito significativas. Como o de Whale, onde o JPMorgan Chase perdeu bilhões e bilhões de dólares devido a erros de planilha. Então, eu tenho a premissa que acho que deve haver uma maneira melhor de fazer as coisas. E, como mencionamos, temos esses cientistas de dados. Esses caras são caros e difíceis de encontrar. E às vezes eles são meio estranhos. Mas acho que, se eu tivesse que resumir o que é um cientista de dados, provavelmente é alguém que entende os dados. Eu acho que é alguém que entende matemática, alguém que entende o problema. E realmente, alguém que possa comunicar os resultados. E se você é um cientista de dados, agora tem muita sorte agora, porque seu salário provavelmente dobrou nos últimos anos.
Mas, para falar a verdade, muitas organizações não possuem esses cientistas de dados, mas sua organização tem pessoas inteligentes. Você tem uma organização, muitas pessoas inteligentes e elas usam planilhas. Você sabe, estatística e matemática não é seu trabalho principal, mas eles usam dados para impulsionar os negócios. Realmente, o desafio que estamos enfrentando é: como você aceita, se tiver sorte de ter um cientista de dados ou um estatístico ou dois, como você pode aceitá-los e como melhorar a colaboração entre essas pessoas e os outras pessoas na sua organização? Se dermos uma olhada em como nossa organização está estruturada, vou começar e vou da direita para a esquerda. E sei que isso é inverso, mas temos essa linha de usuários de negócios.
Essa é a maior parte da sua população de trabalhadores do conhecimento e, para essas pessoas, você precisa incorporar análises em seus aplicativos de linha de negócios. Talvez eles estejam vendo uma saída analítica na tela de um call center ou algo assim, e esteja dizendo a eles a próxima melhor oferta a oferecer ao cliente. Talvez seja um consumidor ou fornecedor em um portal da web, e instantaneamente lhes dê crédito ou coisas assim. Mas a idéia é que eles estão consumindo análises. Se formos para o meio, esses são os trabalhadores do conhecimento. Essas são as pessoas que estão fazendo as coisas com as planilhas hoje, mas elas são propensas a erros e, em algum momento, ficam sem combustível. Esses cientistas de dados de cidadãos, como os chamamos, o que estamos tentando fazer por eles é realmente aumentar o nível de automação.
E você ouve com análises que 80 a 90% do trabalho está na parte de preparação de dados, e não é a matemática real, mas é a preparação de dados. Estamos tentando automatizar isso, faça você, e temos assistentes, modelos e itens reutilizáveis, e você realmente não precisa ter conhecimento da infraestrutura subjacente em seu ambiente. E então, se olharmos para a extrema esquerda, temos esses cientistas de dados. E como eu mencionei, eles são escassos. E o que estamos tentando fazer para torná-los mais produtivos é permitir que eles criem coisas que esses cientistas de dados cidadãos podem fazer. Pense nisso como um bloco de Lego, para que esses cientistas de dados possam criar um ativo reutilizável que um cientista de dados cidadão possa usar. Construa-o uma vez, para que não tenhamos que reinventar a roda.
Além disso, esses caras podem estar preocupados se podemos fazer coisas no banco de dados e alavancar os investimentos em tecnologia existentes que sua empresa fez. Hoje em dia, não faz sentido embaralhar dados de um lado para o outro em todo o mundo. Portanto, se olharmos para o Statistica, como mencionei, é uma plataforma que existe há muito tempo. E é um produto muito inovador. Mistura de dados, não existe uma fonte de dados que não possamos acessar. Temos todas as coisas de descoberta e visualização de dados que você esperaria; nós podemos fazer isso em tempo real. E provavelmente tem - acho que há mais de 16.000 funções analíticas dentro da ferramenta de software, então é mais matemática do que eu jamais poderia usar ou entender, mas está lá se você precisar.
Temos a capacidade de combinar regras de negócios e fluxos de trabalho analíticos para realmente tomar uma decisão de negócios. Você está indo além, aqui está um algoritmo, um fluxo de trabalho, mas você tem regras de negócios com as quais sempre precisa lidar. Nós somos muito seguros na governança. Somos usados em muitos clientes farmacêuticos, na medida em que o FDA confia em nós. Você sabe, basta provar no pudim que temos os controles e a capacidade de auditoria para serem aceitos por eles. Por fim, você sabe, somos abertos, flexíveis e extensíveis; portanto, é necessário criar uma plataforma que permita que seus cientistas de dados sejam produtivos, que seus cidadãos cidadãos sejam produtivos, que sejam capazes de para implantar esses resultados analíticos nos trabalhadores da sua organização.
Se dermos uma olhada, aqui está um exemplo de algumas das visualizações. Mas ser capaz de distribuir sua saída analítica para usuários de linha de negócios, portanto, o primeiro exemplo à esquerda, é um diagrama analítico de rede. E talvez você seja um investigador de fraudes e não saiba como essas conexões são feitas, e estas podem ser pessoas, podem ser entidades, podem ser contratos, qualquer coisa realmente. Mas você pode manipular isso com o mouse e interagir com ele para realmente entender - se você é um investigador de fraudes, para entender uma lista priorizada de quem investigar, certo, porque você não pode falar com todo mundo, então você tem priorizar.
Se olharmos para a imagem do lado direito, para um painel de manutenção preditiva, esse é um problema realmente interessante. Talvez você seja dono de um aeroporto e tenha esses scanners corporais lá. Esses scanners corporais, se você for a um aeroporto, existem alguns componentes que têm vida útil de nove meses. E essas coisas são muito, muito caras. Se eu tiver vários pontos de entrada, vários scanners no meu aeroporto, número um, quero ter certeza de que tenho pessoal adequadamente em cada um dos portões e, para as peças que estão nos scanners, não quero encomendá-los também cedo, e eu quero tê-los antes que se quebre. Temos capacidade, talvez se você possui um aeroporto, de prever quando essas coisas vão quebrar e prever níveis de pessoal.
Se olharmos para o canto inferior direito, isto é, se você estiver em um ambiente de fabricação, isso é apenas uma representação gráfica do fluxo de fabricação. E é um pouco difícil de ver, mas há semáforos vermelhos e verdes nesses vários setores de processo; portanto, se eu sou engenheiro, há uma matemática muito sofisticada, mas posso detalhar esse setor de processo específico e observar os parâmetros e insira isso, talvez fazendo com que isso fique fora de controle. Se olharmos para o cientista de dados do cidadão, nosso objetivo é realmente facilitar para o cientista de dados do cidadão. Temos assistentes e modelos, e uma coisa que acho realmente interessante é que temos esse nó de verificação de integridade de dados automatizado. E realmente o que isso faz, ele tem inteligência embutida.
Mencionei a preparação de dados - leva uma quantidade significativa de tempo, tanto na agregação de dados quanto na sua preparação. Mas vamos supor que eu tenho meus dados, posso executá-los através deste nó de verificação de integridade de dados, e verifica invariância, escassez e outliers, e todas essas coisas, preenche valores ausentes e faz muita matemática entendo, então posso aceitar os padrões ou, se sou um pouco mais inteligente, posso alterá-los. Mas o ponto é que queremos automatizar esse processo. Isso faz cerca de 15 verificações e resultados diferentes em um conjunto de dados limpos. O que estamos fazendo é facilitar para as pessoas a criação desses fluxos de trabalho.
É aqui que falamos sobre a colaboração entre os cientistas de dados e os cientistas de dados dos cidadãos. Se olharmos para essas imagens à direita, vemos o fluxo de trabalho de preparação de dados. E talvez isso seja muito sofisticado, talvez esse seja o molho secreto da sua empresa, não sei, mas sabemos que alguém na sua organização pode acessar um ou mais desses silos de dados que temos. Precisamos de uma maneira de, número um, agarrá-los e costurá-los, e número dois, talvez haja um processamento especial que queremos fazer, que esteja além da verificação de integridade dos dados e esse seja o molho secreto da sua empresa. Posso criar esse fluxo de trabalho em nossa organização e ele é recolhido como um nó. Você vê a seta apontando para baixo, é apenas um nó, e podemos ter centenas dessas coisas dentro de uma organização. A idéia é que temos pessoas que sabem algo sobre um determinado espaço, podem criar um fluxo de trabalho e outra pessoa pode reutilizá-lo. Estamos tentando minimizar a reinvenção da roda.
E podemos fazer o mesmo com os fluxos de trabalho de modelagem analítica. Nesse caso, à direita, nesse fluxo de trabalho, talvez haja 15 algoritmos diferentes, e eu quero escolher o melhor para a tarefa. Como cientista de dados do cidadão, não preciso entender o que está acontecendo naquela bagunça da teia de aranha lá em cima, mas ele simplesmente entra em colapso em um nó, e talvez esse nó simplesmente diga: "calcule a pontuação de risco de crédito". de uma infecção no local cirúrgico ", o que você tem. “Calcule a probabilidade de algo ser uma transação fraudulenta.” Como cientista de dados cidadão, posso usar essa matemática muito sofisticada que alguém construiu, talvez um desses cientistas de dados tenha construído dentro da minha organização.
Da perspectiva da ciência de dados, eu conversei com cientistas de dados que gostam de escrever código, e com cientistas de dados que odeiam escrever código. E tudo bem, por isso temos uma interface gráfica do usuário muito visual. Podemos pegar nossos dados, fazer nossa verificação de integridade de dados automatizada e talvez eu queira escrever código. Gosto de Python, gosto de R, mas a idéia é que esses cientistas de dados estão em falta e gostam do código em uma linguagem específica. Nós particularmente não temos preferência pelo idioma em que você deseja codificar; portanto, se você deseja fazer R, faça R; Se você quiser fazer Python, faça Python. Isso é ótimo. Se você deseja estender suas análises para o Azure, estenda suas análises para a nuvem. Portanto, o objetivo aqui é realmente oferecer flexibilidade e opções para tornar seus cientistas de dados tão produtivos quanto possível.
Agora, cientistas de dados são pessoas muito inteligentes, mas talvez não sejam especialistas em tudo, e talvez haja algumas lacunas no que podem fazer. E se você observar a indústria, existem muitos mercados analíticos diferentes por aí. Este é um exemplo de, talvez eu precise fazer reconhecimento de imagem e não possua essa habilidade, bem, talvez eu vá para Algoritmia e obtenha um algoritmo de reconhecimento de imagem. Talvez eu vá ao Apervita e obtenha um algoritmo de saúde muito especial. Talvez eu queira usar algo na biblioteca de aprendizado de máquina do Azure. Talvez eu queira usar algo na plataforma nativa do Statistica.
Novamente, a idéia aqui é que queremos alavancar a comunidade de análise global. Como você não terá todas as habilidades dentro de suas quatro paredes, então como podemos criar software - e é isso que estamos fazendo - que permita que seus cientistas de dados usem algoritmos de vários mercados. Fazemos isso com R e Python há muito tempo, mas isso está estendendo isso a esses mercados de aplicativos que existem por aí. E o mesmo que você vê aqui no topo disso, estamos usando H2O no Spark, então há muitos algoritmos analíticos lá. Você não precisa se concentrar em criá-los do zero, vamos reutilizar aqueles que vivem na comunidade de código aberto e queremos que essas pessoas sejam o mais produtivas possível.
O próximo passo, depois de termos nossos cientistas de dados cidadãos e nossos cientistas de dados, é realmente como você promove e distribui essas melhores práticas? Temos tecnologia em nosso software que permite distribuir análises em qualquer lugar. E essa é mais uma visão de gerenciamento de modelo, mas não estou mais limitada pelas quatro paredes ou por uma instalação específica em Tulsa, Taiwan ou Califórnia, ou o que você tem. Esta é uma plataforma global e temos muitos clientes implantados em vários sites.
E realmente, as principais coisas são: se você está fazendo algo em Taiwan e deseja replicá-lo no Brasil, isso é ótimo. Vá lá, pegue os modelos reutilizáveis, pegue os fluxos de trabalho que você deseja. Isso está tentando criar esses padrões e a maneira comum de fazer as coisas, por isso não fazemos coisas completamente diferentes em todos os lugares. E o outro componente-chave disso é que realmente queremos levar a matemática para onde os dados estão. Você não precisa embaralhar dados entre Califórnia e Tulsa e Taiwan e Brasil. Temos uma tecnologia que nos permite levar a matemática para os dados e teremos outro webcast de tecnologia quente sobre esse assunto.
Mas chamamos essa arquitetura, e aqui está uma prévia, Arquitetura de Análise Distribuída Nativa. A idéia principal por trás disso é que temos uma plataforma, o Statistica, e posso exportar um fluxo de trabalho analítico como um átomo. E eu poderia fazer um modelo ou um fluxo de trabalho inteiro, para que isso não importasse. Mas posso criar isso e exportá-lo em um idioma apropriado para a plataforma de destino. No lado esquerdo, muitas pessoas fazem isso, mas fazem pontuações no sistema de origem. Tudo bem, podemos fazer a pontuação e a criação de modelos no banco de dados, então isso é interessante.
E então, no lado direito, temos o Boomi. Esta é uma tecnologia complementar, trabalhamos com tudo isso. Mas também podemos pegar esses fluxos de trabalho e transportá-los essencialmente para qualquer lugar do mundo. Qualquer coisa que tenha um endereço IP. E não preciso ter um Statistica instalado na nuvem pública ou privada. Qualquer coisa que possa executar uma JVM, podemos executar esses fluxos de trabalho analíticos, fluxos de trabalho de preparação de dados ou apenas modelos em qualquer uma dessas plataformas de destino. Seja na minha nuvem pública ou privada, seja no meu trator, no meu carro, na minha casa, na minha lâmpada, na minha Internet das coisas, temos uma tecnologia que permite transportar esses fluxos de trabalho para qualquer lugar do mundo.
Vamos revisar. Você sabe, temos usuários de linha de negócios, portanto, essas pessoas, temos tecnologia que permite consumir a saída em um formato que lhes agrada. Temos cientistas de dados cidadãos, e o que estamos tentando fazer é melhorar a colaboração, torná-los parte de uma equipe, certo? E assim queremos que as pessoas parem de reinventar a roda. E nós temos esses cientistas de dados, pode haver uma lacuna de habilidades lá, mas eles podem codificar em um idioma que desejam, podem ir aos mercados analíticos e usar algoritmos lá. E então, com isso, como você pode não pensar que tudo é incrível com isso? Isso é perfeito, é isso que estamos fazendo. Estamos construindo fluxos de trabalho reutilizáveis, dando instruções às pessoas, dando-lhes os blocos de Lego para que eles possam construir esses poderosos castelos e o que quiserem. Para resumir, temos uma plataforma que capacita usuários de linha de negócios, cientistas de dados cidadãos, cientistas de dados de programadores, nós temos - podemos abordar qualquer tipo de caso de uso de análise de ponta da IoT e estamos habilitando essa noção de inteligência coletiva. Com isso, acho que provavelmente abriremos para perguntas.
Robin Bloor: Bem, tudo bem. Acho que o primeiro - quero dizer, para ser honesto, quero dizer que já fui informado pelo Dell Statistica antes, e para ser honesto, estou realmente bastante surpreso com as coisas que eu não sabia que você mencionou na apresentação . E eu tenho que dizer que a única coisa, é algo que tem sido um problema para mim na adoção da análise, é que, você sabe, obter as ferramentas, não é, sabe? Há uma enorme quantidade de ferramentas por aí, ferramentas de código aberto, e assim por diante, e há várias, o que eu chamaria de semi-plataformas. Mas acho que a diferença que você tem, fiquei particularmente impressionado com parte do fluxo de trabalho.
Mas a diferença é que você parece fornecer de ponta a ponta. É como se a análise fosse um processo de negócios sofisticado que começa com a aquisição de dados e, em seguida, passa por uma série de etapas, dependendo de quão esquisitos os dados sejam, e pode se ramificar em uma série inteira de diferentes ataques matemáticos no dados. E então os resultados surgem de uma maneira ou de outra e esses precisam ser ações. Há uma quantidade enorme de análises que me deparei com muito trabalho excelente, mas não há como colocá-lo em ação. E você parece ter muito do que é necessário. Não sei o quão abrangente é, mas é muito mais abrangente do que eu esperava. Estou incrivelmente impressionado com isso.
Gostaria que você comentasse em planilhas. Você já disse alguma coisa, mas uma das coisas que eu notei e observei ao longo dos anos, mas ficou cada vez mais aparente, é que existem muitas planilhas que são sistemas de sombra e realmente acho a planilha, quero dizer, era uma ferramenta maravilhosa quando foi introduzida e tem sido maravilhosa desde então de várias maneiras diferentes, mas é uma ferramenta generalizada, não é realmente adequada ao seu objetivo. Certamente não é muito bom no contexto de BI e acho terrível no contexto de análise. E me perguntei se você tinha algum comentário a fazer sobre, digamos, exemplos em que, sabe, o Statistica foi liberado, uso excessivo de planilhas ou algum comentário que você gostaria de fazer sobre isso?
David Sweenor: Sim, eu acho que, você sabe, pode procurar erros famosos em planilhas. O Google ou qualquer outro mecanismo de pesquisa que você estiver usando retornará com uma série de resultados. Acho que nunca substituiremos planilhas. Essa não é a nossa intenção, mas para muitas organizações que frequento, existem alguns desses assistentes de planilha ou ninjas ou o que você quiser chamá-los, mas eles têm essas planilhas muito sofisticadas e você deve pensar: o que acontece quando essas as pessoas ganham na loteria e não voltam? Então, o que estamos tentando fazer é que sabemos que existem planilhas para que possamos ingeri-las, mas acho que o que estamos tentando fazer é desenvolver uma representação visual do seu fluxo de trabalho para que possa ser entendido e compartilhado com outras pessoas . As planilhas são muito difíceis, muito difíceis de compartilhar. E assim que você passa sua planilha para mim, eu a mudei e agora estamos fora de sincronia e obtemos respostas diferentes. O que estamos tentando fazer é colocar algumas grades de proteção em torno disso e tornar as coisas um pouco mais eficientes. E as planilhas são realmente terríveis ao combinar vários conjuntos de dados, sabe? Eles caem lá em baixo. Mas não vamos substituí-los, ingeri-los e temos pessoas que estão começando a mudar, porque se tivermos um nó que diz "calcular risco", é isso que a pessoa que usa a planilha está tentando fazer. Então esses se foram.
Robin Bloor: Sim, eu diria que, de uma das perspectivas em que olho as coisas, eu diria que as planilhas são ótimas para criar informações. Eles são ótimos para criar ilhas de conhecimento, mas são muito ruins para compartilhar conhecimento. Eles não têm nenhum mecanismo para fazer isso e, se você passar uma planilha para alguém, não é possível ler como se fosse um artigo que explica exatamente o que está fazendo. Apenas não está lá. Eu acho que a coisa que mais me impressionou na apresentação e nas capacidades do Statistica parece ser incrivelmente agnóstico. Mas ele tem esse thread em execução no fluxo de trabalho. Estou certo ao supor que você poderia observar um fluxo de trabalho de ponta a ponta, desde a aquisição de dados até a incorporação de resultados em aplicativos de BI específicos ou mesmo aplicativos em execução?
David Sweenor: Sim, absolutamente. E ele tem essa capacidade de ponta a ponta e algumas organizações usam isso totalmente, e não tenho ilusão de que nenhuma empresa hoje em dia compre tudo de um fornecedor. Nós temos uma mistura. Algumas pessoas usam o Statistica para tudo e outras usam para os fluxos de trabalho de modelagem, outras usam para os fluxos de trabalho de preparação de dados. Algumas pessoas o usam para distribuir centenas de relatórios de engenharia aos engenheiros. E então temos tudo no meio. E é realmente de ponta a ponta e é, você sabe, uma plataforma agnóstica, pois se houver algoritmos que você deseja usar no R ou Python, Azure, Apervita, o que você quiser, use-os. Isso é ótimo, seja produtivo, use o que você sabe, use o que você se sente confortável e temos mecanismos para garantir que eles sejam controlados, auditáveis e todo esse tipo de coisa.
Robin Bloor: Eu particularmente gosto desse aspecto. Quero dizer, não sei se você pode falar além do que disse à riqueza do que está por aí. Quero dizer, eu olhei para isso, mas não o analisei de maneira abrangente e certamente há uma grande quantidade de bibliotecas Python em nossas bibliotecas, mas há algo que você possa adicionar a essa imagem? Porque eu acho que é uma coisa muito interessante, você sabe, a idéia de que você teria componentes confiáveis, porque você conheceu várias pessoas que as criaram e várias pessoas que as estavam usando para baixar. Você sabe, você pode enriquecer o que você já disse sobre isso?
David Sweenor: Sim, acho que alguns dos mercados de aplicativos, você sabe, os mercados de algoritmos que existem por aí. Por exemplo, o Dr. John Cromwell, da Universidade de Iowa, desenvolveu um modelo que preverá, usado em tempo real enquanto estamos sendo operados, fornecerá uma pontuação se você quiser obter uma infecção do sítio cirúrgico. E se essa pontuação for alta o suficiente, eles farão uma intervenção na sala de cirurgia. Isso é muito interessante. Então talvez haja outro hospital que não seja tão grande. Bem, o Apervita é um mercado de aplicativos de saúde para análises. Você pode encontrar um em muitos desses mercados de aplicativos, pode encontrar um e reutilizá-los, e a transação é entre você e quem é o proprietário, mas pode encontrar um ou pode dizer: “Aqui está o que eu preciso. ”Acho que está aproveitando a comunidade global porque hoje em dia todo mundo é especialista e você não pode saber tudo. Eu acho que R e Python são uma coisa, mas essa idéia de: "Quero fazer essa função, coloque uma especificação em um desses mercados de aplicativos e alguém o desenvolva para você". E eles podem monetizar isso, eu acho isso é muito interessante e muito diferente do que puramente o modelo de código aberto.
Robin Bloor: Tudo bem. Enfim, eu vou passar a bola para Dez. Gostaria de mergulhar, Dez?
Dez Blanchfield: Absolutamente e eu gostaria de ficar na planilha apenas por um momento, porque acho que capturou a essência certa de muito do que estamos falando aqui. E você fez um comentário, Robin, com relação à transição de um tipo de planilha antiga em formato físico para formato eletrônico. Tivemos uma coisa interessante em que, quando as planilhas eram originalmente uma coisa, eram apenas folhas de papel com linhas e colunas e você anotava manualmente as coisas e depois as detalhava e calculava, fazendo em cima da cabeça ou com outro dispositivo. Mas ainda temos a oportunidade de inserir erros com erros de caligrafia ou dislexia, e agora substituímos por erros de digitação. O risco é que, com as planilhas, o perfil de risco seja mais rápido e maior, mas acho que ferramentas como o Statistica invertem a pirâmide de riscos.
Costumo desenhar esse quadro no quadro branco de uma figura humana no topo, como uma pessoa, e depois uma coleção deles no fundo, digamos, imagine dez deles no fundo do quadro, e faço um desenho pirâmide onde o ponto da pirâmide está na única pessoa e o pé da pirâmide é a coleção de pessoas. E uso isso para visualizar a ideia de que se uma pessoa no topo comete uma planilha e a compartilha com dez pessoas, e agora temos dez cópias do erro. Tenha muito cuidado com suas macros e muito cuidado com seu Visual Basic, se você for mudar para isso. Porque quando criamos ferramentas eletrônicas como planilhas, é muito poderoso, mas também é poderoso de uma maneira boa e ruim.
Eu acho que ferramentas como o Statistica trazem a capacidade de inverter esse perfil de risco e é que agora você pode chegar ao ponto em que você tem muitas ferramentas disponíveis para cada pessoa e à medida que elas passam por muitas ferramentas no topo da página. a pirâmide e, em seguida, até o fundo, onde o ponto da pirâmide agora invertida é a ferramenta real, se tivermos uma equipe de pessoas que está construindo essas ferramentas e esses algoritmos. E o cientista de dados não precisa ser especialista em análises regressivas em seus dados. Eles podem ser capazes de usar a ferramenta, mas você pode ter cinco ou seis estatísticos e um atuário e um cientista de dados e alguns matemáticos trabalhando nessa ferramenta, naquele módulo, nesse algoritmo, nesse plug-in e assim por diante na linguagem da planilha, portanto imagine que todas as planilhas publicadas que você poderia usar foram realmente escritas por especialistas que testaram as macros, testaram o Visual Basic, certificaram-se de que os algoritmos funcionavam. Assim, quando você o obtinha, podia inserir dados nele, mas na verdade não era possível e, portanto, tem sido melhor controlar.
Eu acho que muitas das ferramentas de análise estão fazendo isso. Eu acho que chegando ao ponto disso, você está vendo isso agora em campo, está vendo a transição de planilhas que potencialmente poderiam gerar erros, erros e riscos, até o ponto em que as ferramentas que você está construindo com o seu plataformas agora, com a descoberta de dados sendo precisa em tempo real e as pessoas que estão construindo os módulos e algoritmos estão removendo ou reduzindo esse perfil de risco? O atendimento ao cliente está vendo isso em um sentido real ou você acha que isso está acontecendo e eles não percebem?
David Sweenor: Sabe, acho que existem algumas maneiras de responder a isso. Mas o que estamos vendo é, em qualquer organização, e mencionei que a análise talvez tenha ficado para trás da perspectiva do investimento corporativo, como fizemos com o data warehousing e CRM. Mas o que estamos vendo, portanto, é preciso muito para mudar uma organização, superar essa inércia organizacional. Mas o que estamos vendo são pessoas pegando suas planilhas, seus fluxos de trabalho, e mencionei a segurança e a governança: "Bem, talvez eu tenha uma planilha", "Bem, posso bloquear isso e controlar a versão". vemos muitas organizações, talvez elas apenas comecem por aí. E se mudou, existe um fluxo de trabalho e eu acabo indo, número um, quem mudou? Por que eles mudaram? Quando eles mudaram. E também posso configurar um fluxo de trabalho para que eu não coloque esta nova planilha em produção, a menos que seja validada e verificada por uma, duas, três, independentemente de quantas partes você deseja definir no seu fluxo de trabalho. Acho que as pessoas estão começando a dar passos, e as organizações estão começando a dar pequenos passos por lá, mas eu provavelmente sugeriria que ainda temos um longo caminho a percorrer.
Dez Blanchfield: De fato, e acho que, considerando que você está construindo tanto nos controles de segurança quanto na governança, a carga de trabalho pode mapear automaticamente isso e tudo até o diretor de risco, o que agora é uma coisa. Você pode começar a controlar como essas ferramentas e sistemas estão sendo acessados e quem está fazendo o que com eles, o que é muito poderoso. Eu acho que as outras coisas que entram nisso são que os tipos de ferramentas que você fornece, para mim, emprestam ao comportamento humano mais do que às planilhas tradicionais de que estamos falando, que se eu tiver uma sala cheia de pessoas com o mesmo painel e acesso aos mesmos dados para que eles possam obter uma visão diferente e, como resultado, obter insights ligeiramente diferentes das mesmas informações, que atendam às suas necessidades para que possam colaborar. Temos então uma visão e interação mais humanas com os negócios e o processo de tomada de decisão, ao contrário de todos irmos para a mesma reunião com o mesmo PowerPoint e as mesmas planilhas impressas, os mesmos dados fixos.
Você vê uma transição de comportamento e cultura nas organizações que meio que adotam suas ferramentas agora onde elas veem isso acontecer, onde não são cinco pessoas na sala olhando para a mesma planilha tentando apenas verbalizá-la e fazer anotações, mas agora eles estão realmente interagindo com os painéis e as ferramentas em tempo real, com a visualização e as análises na ponta dos dedos e obtendo um fluxo completamente diferente na conversa e na interação, não apenas nas reuniões, mas apenas na colaboração geral da organização? Porque eles podem fazer isso em tempo real, porque eles podem fazer as perguntas e obter uma resposta real. É uma tendência que você está vendo no momento ou ainda não aconteceu?
David Sweenor: Não, acho que definitivamente começou nesse caminho e acho que o mais interessante é, se usarmos o exemplo de uma fábrica, por exemplo. Talvez alguém que possua um setor de processo específico nessa fábrica deseje analisar e interagir com esses dados de uma certa maneira. E talvez eu, com vista para todos os processos, talvez este na parte inferior, talvez eu queira ver isso em tudo. Acho que estamos vendo, número um, as pessoas começarem a usar um conjunto comum de visualizações ou visualizações padrão em suas organizações, mas também é adaptado à função em que estão. Se eu sou engenheiro de processos, talvez essa é uma visão muito diferente de alguém que está olhando para ela da perspectiva da cadeia de suprimentos, e eu acho que isso é ótimo porque precisa ser adaptado e deve ser visto através das lentes de que você precisa para fazer seu trabalho.
Dez Blanchfield: Eu acho que o processo de decisão diminui, em termos de tempo e velocidade, para tomar decisões inteligentes e precisas também aumenta rapidamente, não é? Porque se você tem análises em tempo real, painéis em tempo real, se você tem as ferramentas do Statistica na ponta dos dedos, não precisa correr pelo chão para perguntar a alguém sobre algo, você tem em cópia impressa. Você pode colaborar, interagir e realmente tomar decisões rapidamente e obter esse resultado imediatamente. Acho que algumas das empresas realmente não entenderam ainda, mas quando o fizerem será esse momento eureka que, sim, ainda podemos permanecer em nossos cubículos e trabalhar em casa, mas podemos interagir e colaborar e essas decisões quando fazemos a colaboração, transformamos os resultados instantaneamente. Olha, acho que foi fantástico ouvir o que você tem a dizer até agora e estou realmente ansioso para ver para onde vai. E eu sei que temos muitas perguntas nas perguntas e respostas, então vou voltar para Rebecca para analisar algumas delas, para que possamos responder o mais rápido possível. Muito obrigado.
Rebecca Jozwiak: Obrigado Dez, e sim Dave, temos algumas perguntas da platéia. E também agradecemos a Dez e Robin por suas idéias. Eu sei que essa participante em particular teve que parar logo no início da hora, mas ela pergunta: você vê que os departamentos de sistemas de informação estão colocando mais prioridade nos sofisticados controles de dados, em vez de se sentirem confortáveis em fornecer ferramentas para os trabalhadores do conhecimento? Quero dizer, é isso - vá em frente.
David Sweenor: Sim, acho que depende da organização. Acho que um banco, uma companhia de seguros, talvez eles tenham diferentes prioridades e maneiras de fazer as coisas, em comparação com uma organização de marketing. Acho que tenho que dizer que depende apenas da indústria e da função que você está olhando. Diferentes indústrias têm diferentes focos e ênfases.
Rebecca Jozwiak: Tudo bem, isso faz sentido. E então outro participante quis saber, qual é o mecanismo por trás do Statistica? É C ++ ou seu próprio material?
David Sweenor: Bem, eu não sei se consigo entender isso de maneira específica, já que isso existe há 30 anos e foi desenvolvido antes do meu tempo, mas há uma biblioteca principal de algoritmos analíticos que são os algoritmos Statistica que são executados. E você viu aqui que também podemos rodar R, podemos rodar Python, podemos ir para o Azure, podemos rodar no Spark no H2O, então acho que teria que responder a essa pergunta em termos de, é uma variedade de mecanismos. E, dependendo de qual algoritmo você escolher, se for um Statistica, será executado assim, se você escolher um no H2O e Spark, ele será usado e, portanto, é uma variedade deles.
Rebecca Jozwiak: Tudo bem. Outro participante meio que perguntou especificamente apontando para este slide, querendo saber, tipo, como o cientista de dados do cidadão sabe quais modelos reutilizáveis usar? E acho que vou fazer uma pergunta mais ampla com isso. Isso, o que você vê quando os usuários da linha de negócios ou analistas de negócios entram e desejam usar essas ferramentas? Quão fácil é para eles começarem a trabalhar?
David Sweenor: Eu acho que eu responderia isso e, se você puder usar, se você estiver familiarizado com o Windows, esta é uma plataforma baseada no Windows, então cortei a parte superior dessas capturas de tela, mas tem a faixa do Windows. Mas como eles sabem qual fluxo de trabalho usar? Parece com o Windows Explorer, então há uma estrutura em árvore e você pode configurá-lo e configurá-lo da maneira que sua organização deseja configurá-lo. Mas pode ser que você tenha essas pastas e coloque esses modelos reutilizáveis dentro dessas pastas. E acho que provavelmente existe uma nomenclatura que sua empresa poderia adotar, digamos aqui o "cálculo do perfil de risco", o "obter dados dessas fontes" e você os nomeia como quiser. É apenas uma pasta gratuita, basta arrastar as notas para a tela. Então, muito fácil.
Rebecca Jozwiak: Tudo bem. Talvez uma demonstração na próxima vez. Então outro participante aparece e é sobre isso que você e Robin e Dez estavam falando sobre as imprecisões, especialmente em uma planilha, mas o lixo entra / sai, e ele vê isso como sendo ainda mais crítico quando se trata para análise. Mencionar que, você sabe, o uso indevido de dados pode realmente levar a algumas decisões infelizes. E ele está se perguntando quais são suas opiniões sobre o desenvolvimento de algoritmos à prova de falhas, eu acho que, ele usa a palavra "uso excessivamente zeloso" da análise. Você sabe, alguém entra, fica realmente empolgado, quer fazer essas análises avançadas, quer executar esses algoritmos avançados, mas talvez não tenha muita certeza. Então, o que você faz para se proteger contra isso?
David Sweenor: Sim, acho que vou responder da melhor maneira possível, mas acho que tudo se resume a pessoas, processos e tecnologia. Temos uma tecnologia que ajuda a capacitar as pessoas e a habilitar qualquer processo que você queira colocar na sua organização. No exemplo de envio de um cupom para alguém, talvez isso não seja tão crítico e, se for digital, não custa, talvez exista um nível de controle de segurança e talvez não nos importemos. Se estou prevendo infecções no local da cirurgia, talvez queira ter um pouco mais de cuidado com isso. Ou, se estou prevendo a qualidade e segurança dos medicamentos e coisas assim, talvez eu queira ter um pouco mais de cuidado com isso. Você tem razão, entrada / saída de lixo, então o que tentamos fazer é fornecer uma plataforma que permita adaptá-la ao processo que sua organização deseja adotar.
Rebecca Jozwiak: Tudo bem. Eu tenho mais algumas perguntas, mas sei que já passamos um pouco da hora e só quero dizer aos nossos apresentadores que foi incrível. E queremos agradecer a Dave Sweenor, da Dell Statistica. Claro, Dr. Robin Bloor e Dez Blanchfield, obrigado por serem os analistas hoje. No próximo mês, teremos outro webcast com o Dell Statistica. Eu sei que Dave meio que deu dicas sobre o assunto. Será sobre análise no limite, outro tópico fascinante, e eu sei que alguns casos de uso muito convincentes serão discutidos nesse webcast. Se você gostou do que viu hoje, volte para mais no próximo mês. E com isso, pessoal, eu lhes digo adeus. Muito obrigado. Tchau tchau.