Uma fascinante apresentação de Kate Crawford, pesquisadora principal da Microsoft Research, na Strata Conference de 2013, analisa mais de perto os big data e o que isso significa, explorando algumas das coisas que Crawford chama de "ilusões algorítmicas" e as limitações das soluções de dados em larga escala que estão sendo adotados em muitas partes do mundo dos negócios.
Usando uma analogia fundamental para uma ilusão de ótica envolvendo um gato giratório, Crawford argumenta que, embora o big data seja essencial para muitos aplicativos de negócios, há mais de uma maneira de interpretar muitos dos resultados de conjuntos de dados que podem parecer objetivos para os tomadores de decisão humanos .
"As coisas podem ser vistas de maneira diferente", disse Crawford, citando um artigo no qual ela e o co-autor David Boyd refletem sobre alguns dos principais princípios do uso de big data, incluindo o que Crawford chama de "mitologia" ou a crença de que o big data traz verdade absoluta. e objetivismo a um projeto. Segundo ela, os líderes costumam associar diretamente dados grandes a uma visão objetiva, ignorando o que ela chamou de três limitações ou considerações fundamentais que podem afetar essa objetividade de maneiras importantes: viés, sinal e escala.
Começando com o viés, Crawford usa exemplos de inundações na Austrália e nos Estados Unidos para mostrar que o big data nem sempre combina com a realidade nas ruas. Ela vincula o segundo princípio, sinal, ilustrando ainda mais como os conjuntos de dados podem refletir realidades ocultas que podem distorcer fortemente os resultados. Como exemplo, Crawford citou os vários tipos de mapas do mundo que foram desenvolvidos na tentativa de mostrar uma visão objetiva do tamanho relativo dos continentes e nações.
"Os mapas não são neutros", disse Crawford. "Estamos fazendo escolhas sempre que decidimos representar nossos dados".
Para ilustrar melhor o princípio, Crawford usa o exemplo de um aplicativo que reporta buracos em Boston às autoridades da cidade, sugerindo que esses tipos de aplicativos que funcionam em smartphones e dispositivos móveis podem fazer com que os relatórios gerais se pareçam muito com mapas censitários indicando idade relativa e renda em uma cidade ou município.
"Corremos o risco de consolidar ainda mais tipos específicos de desigualdade social", disse Crawford, apontando para aqueles que podem ficar de fora de um determinado conjunto de big data devido a diferenças no uso da tecnologia.
"O que acontece se você vive na sombra de grandes conjuntos de dados?" ela disse.
Além disso, Crawford também fala sobre pesquisas de anos atrás que questionavam se as informações de alto nível sempre representam dados mais granulares e se um "panorama objetivo" sempre funciona como uma representação mais precisa do que os dados em uma escala menor. Crawford também pede aos ouvintes que pensem não apenas em big data, mas em "dados detalhados". Com isso, ela quer dizer dados que realmente orientam os leitores em direção à realidade objetiva, em vez de encobrir detalhes com uma abordagem mais global que, embora mais fácil de entender, pode deixar de fora os principais elementos do que realmente existe.