Resumo
Data Mining é o processo de encontrar anomalias, padrões e correlações em grandes conjuntos de dados para prever resultados. Usando uma ampla variedade de técnicas, é possível usar essas informações para aumentar as receitas, cortar custos, melhorar o relacionamento com os clientes, reduzir riscos e muito mais.
Histórico
O processo de Data Mining para descobrir conexões ocultas e prever tendências futuras tem uma longa história. Às vezes referido como “descoberta de conhecimento em bancos de dados”, o termo ” Data Mining ” não foi cunhado até a década de 1990. Mas sua base compreende três disciplinas científicas interligadas: estatística (o estudo numérico das relações de dados), inteligência artificial (inteligência semelhante à humana exibida por software e / ou máquinas) e aprendizado de máquina (algoritmos que podem aprender com dados para fazer previsões).
Avanços
Durante a última década, os avanços no poder de processamento e velocidade nos permitiram ir além das práticas manuais, tediosas e demoradas para a análise de dados rápida, fácil e automatizada. Quanto mais complexos forem os conjuntos de dados coletados, mais potencial haverá para descobrir insights relevantes. Varejistas, bancos, fabricantes, provedores de telecomunicações e seguradoras, entre outros, estão usando mineração de dados para descobrir relações entre tudo, desde otimização de preços, promoções e demografia até como a economia, risco, concorrência e mídia social estão afetando seus modelos de negócios, receitas, operações e relacionamento com o cliente.
Importância
O volume de dados produzidos está dobrando a cada dois anos. Somente dados não estruturados (áudio, texto,vídeo) compõem 90% do universo digital. Mas mais informação não significa necessariamente mais conhecimento.
Aplicação