Lar Nas noticias O que é a disputa de dados? - o que é techopedia

O que é a disputa de dados? - o que é techopedia

Índice:

Anonim

Definição - O que significa Data Wrangling?

A organização de dados é um tipo específico de gerenciamento de dados que surgiu dos novos recursos de software, introduzindo conjuntos de dados grandes, confusos e diversos que precisam entrar em uma arquitetura orientada a serviços (SOA) para fins de análise e uso. A organização de dados geralmente envolve muitas técnicas sofisticadas diferentes para manipular dados irregulares ou diversos e manipulá-los para casos de uso de negócios.

Techopedia explica a disputa de dados

Pode parecer um termo informal, mas a disputa de dados na verdade ocupa um espaço específico no gerenciamento de dados. Uma maneira útil de entender a disputa de dados é contrastá-la com a metodologia geralmente mais formal de extração, transformação e carregamento (ETL). A organização de dados tem aspectos e casos de uso diferentes do ETL. Isso geralmente é feito por cientistas de dados qualificados ou por outros que estão próximos do oleoduto. De certa forma, a disputa de dados pode ser chamada de tipo de ETL de "código aberto", na medida em que os engenheiros que lidam com os dados podem ser mais "práticos" ou usar mais métodos manuais de extração.

Para aqueles que realmente entendem os processos refinados pelos quais diversos dados são selecionados, classificados e alimentados em arquiteturas corporativas, a disputa de dados é realmente um tópico muito importante. Os profissionais de TI analisam uma vasta gama de ferramentas, recursos e técnicas para agregar valor a partir de dados confusos, brutos ou não estruturados.

O que é a disputa de dados? - o que é techopedia