Existe uma diversidade de fontes fornecedoras de dados dentro e fora das organizações. Mas abordando um universo mais específico, dentro de uma empresa os dados são incontáveis. Imagine só: uma planilha do setor de vendas é um dado, os relatórios de mídia são dados, as informações no CRM são dados. Porém é inegável que o acesso direto a essas informações permite que tenhamos dados brutos, muitas vezes cheio de ruídos e sem um formato definido, tornando os de difícil compreensão.
É aí que entra o data mining. Para quem não é familiarizado com o assunto, data mining é um conjunto de técnicas aplicadas computacionalmente que buscam os dados e modelam estes dados para uma forma legível. As técnicas de data mining têm como objetivo a descoberta de novos padrões e percepção de padrões já definidos.
Ou seja, por meio de métodos estatísticos e com auxílio de inteligência artificial, aprendizado de máquina e consultas em bancos de dados, se torna possível a mineração de maneira eficiente de acordo com um determinado objetivo.
Antes de nos aprofundarmos no data mining em si, é importante voltamos ao conceito de o que são os dados. Vamos lá:
O que são Dados
Dados são quaisquer tipos de fatos, números ou textos que podem ser processados por um computador. Hoje em dia as organizações produzem montantes exorbitantes de dados a cada segundo em diversos formatos. Além disso, como já falamos, os dados podem ser encontrados em diversas fontes, que incluem:
- Dados operacionais e transacionais, como vendas, custos, inventários, pagamentos e contabilidade;
- Dados não operacionais, como dados de previsão e dados macroeconômicos;
- Metadados são aqueles dados que falam sobre o dado em si. Um bom exemplo de metadado é como ele deve ser considerado com relação a seu formato (01/02/2016 dia/mes/ano).
Os blocos de informação
Os dados operacionais associados aos dados não operacionais e metadados permitem a definição de padrões capazes da construção de blocos de informação.
As informações de venda de um determinado período podem, por exemplo, ser associadas a dados de previsão para definir estratégias de atuação. Além disso, por meio da especificação ou uso de metadados existentes, se torna possível a formatação da informação.
Temos como no exemplo citado anteriormente de metadados a especificação de como uma data deve ser considerada, dd/mm/aaaa. Ou seja, por meio daquele formato pré-estabelecido, sabemos que a informação de data deve seguir o padrão dia/mês/ano e que dia deve possuir 2 dígitos, mês 2 dígitos e ano 4 dígitos.
Os metadados funcionam como um descritor em que reside a forma que o dado deve conter para ser compreensível. É como um manual de instruções de um dado específico onde sabemos o que ele significa e como ele deve ser armazenado. Para uma leitura efetiva de um dado então precisamos saber como ele deve ser lido e avaliado e para seu armazenamento isto também é essencial.
Como estruturar seus dados?
Sabendo o que são os dados, a sua importância e tendo compreendido os blocos de informação, é importante falarmos da estruturação desses dados para que você possa utilizá-los em suas ações.
Sempre que se fala em análise de dados dentro das organizações, recuperamos automaticamente as famosas planilhas. Este formato é interessante em diversos aspectos, mas ainda apresenta uma série de limitações.
A planilha se mostra bastante falha quando tratamos de dados de naturezas diferentes. Não se consegue estabelecer dados de vendas e dados de web analytics na mesma planilha, por exemplo. Ou seja, quando utilizamos apenas planilhas temos então um gasto excessivo de horas de dedicação a análise e manipulação dos dados de maneira manual, já que cada tipo de dado está em uma planilha diferente.
O data mining vem para suprir a necessidade de automatizar este processo. O uso de linguagens de programação e tecnologia de banco de dados permitem que os dados sejam obtidos, tratados e expostos de maneira automática e inteligente, fornecendo uma atuação em tempo real a cerca dos dados processados, que a partir de então possuem uma estrutura definida.
A estrutura de um dado se dá através da adição de um determinado contexto onde ele se tornará informação. Um dado onde temos o valor em reais de venda não traz nenhuma informação além do que ela significa por si mesma. Adicionando o dado que especifica o mês ao qual aquele valor se refere temos a informação de venda mensal. Um pouco mais adiante, se tivermos os valores e os itens vendidos naquele mês podemos saber qual destes itens representam a maior fonte de receita daquele mês. Todo este processo pode ser automatizado e durante o processo podem ser percebidos padrões que evidenciam comportamentos que podem gerar insights analiticos, preditivos e prescritivos.
Conseguiu compreender a importância do data mining dentro do marketing por dados? Tem alguma dúvida? Comente esse post, será um prazer conversar com você!