É possível predizer o consumo de energia elétrica usando Machine Learning e Data Science?

Primeiramente, deixe-me dizer que é extremamente difícil predizer com confiabilidade algo do gênero, sem deter um bom conhecimento matemático e estatístico. Predizer o consumo de energia elétrica de uma unidade consumidora, pode ser extremamente traiçoeiro se não souber quais dados usar e como usá-los.


Contudo, apesar de tudo dito anteriormente, se você conseguir predizer este consumo com melhor confiabilidade, a capacidade de economia desta unidade consumidora será muito maior. Por exemplo: Será possível determinar se devo mudar meu contrato do Mercado Livre para os próximos meses, se minha geração distribuída será o suficiente para fornecer energia para seus dependentes, ou até mesmo, se devo readequar meu contrato com minha concessionária de energia elétrica. Alterações como estas, com nossa experiência, podem facilmente propiciar uma economia mensal média de aproximadamente 17%, sem um centavo de investimento inicial. Uma ferramenta poderosa, nas mãos daqueles que sabem e querem usar, trazem ganhos significativos na decisão.


Com tudo isso dito, vamos ao que interessa. Toda as abordagens feitas neste artigo estão baseadas no livro: James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An Introduction to Statistical Learning: with Applications in R (Springer Texts in Statistics) (1st ed. 2013, Corr. 7th printing 2017 ed.). Springer.



PRIMEIRA ETAPA: CAPTURA DOS DADOS E SELEÇÃO DE DADOS


Esta etapa é extremamente importante, pois ela impacta diretamente na precisão dos resultados. A empresa Economizenergia detém um software de captura de informações, onde esta ferramenta, consegue capturar todos os dados não genéricos e relevantes das faturas de energia elétrica. Esta ação facilita a captura dos dados e melhora a confiabilidade dos dados. A figura 1 abaixo apresenta um exemplo de coleta de dados de uma fatura genérica.

Figura 1 - Dados parciais das faturas selecionadas



Após esta etapa de coleta de informa, é importante, conseguirmos definir quais dados são, ou não, relevantes para desenvolver o modelo de predição. Dados qualitativos, como: CNPJ, NFe, Data de Vencimento e similares, não são relevantes para este caso em específico. Dados quantitativos, possuem um grande valor agregado no desenvolvimento desta ferramenta, utilizar do conceito de HeatMap e Correlação de Variáveis podem ajudar significativamente na determinação do valor agregado destas variáveis. A figura 2 apresenta um exemplo de HeadMap das variáveis.

Figura 2 - HeatMap das variáveis



Próximo passo é a realização do que chamamos de “Análise Exploratória de Dados”. É recomendado verificar qual ferramenta de Machine Learning se adapta melhor aos seus dados, e existem ferramentas estatísticas que podem auxiliar a determinar qual destes modelos é o ideal. Neste caso, apenas como método demonstrativo, vamos usar o “mean square error” (MSE), dado por:

Onde é a predição dada por para cada observação de . O MSE será menor quanto mais perto dos valores reais, a predição for. É possível plotar o gráfico do MSE em relação a resposta real em relação a cada modelo. Neste caso vamos ver como o MSE se comporta, se utilizássemos um método preditivo simples, mas não recomendado, a Regressão Linear. A figura 3 abaixo apresenta visualização da adoção da regressão linear:

Figura 3 - Progressão do MSE



Nota-se a possibilidade de uma grande variação do MSE ao longo do modelo, o que não é bom para a modelagem. É possível realizar um “over-fit” nesta Regressão Linear, para tentar alcançar um resultado mais satisfatório para algumas Unidades Consumidoras, o que nunca é recomendado, pois esta ferramenta não irá permitir seu modelo prever casos sazonais ou que possuem bruscas mudanças de consumo de energia, mas faremos uma demonstração para ver como um modelo com baixo MSE se comporta, como mostrado abaixo na Figura 4:

Figura 4 - Progressão do MSE (2)



A empresa Economizenergia testa 25 modelos distintos de Machine Learning simultaneamente para as Unidades Consumidoras, em busca de um que melhor se adeque, ou seja, que apresente uma forma mais próxima da realidade histórica. Após obtenção do modelo ideal, será possível treinar a inteligência com esses dados adquiridos e analisados previamente.


Uma boa prática é comparar o teste de predição com o valor real para verificar o erro observado. O modelo de Regressão Linear possuiu, como mostrado abaixo na figura 5, alguns casos com erro de até 30%, o que não o torna um método confiável.

Figura 5 – Erro (%) vs. N. de testes


A empresa Economizenergia possui historicamente uma média de precisão na predição de Unidades com consumo constantes de 97,37% e de Unidades Sazonais com precisão de 92,24%. Conforme pode ser observado, trata-se de valores confiáveis na tomada de decisão para otimizar sua economia.


Entre em contato conosco através do e-mail contato@economizenergia.com.br caso tenham alguma dúvida sobre o que foi abordado nesta matéria ou tenham interesse em aplicar esta solução em sua empresa, estamos dispostos a ajudar você e a sua empresa a obter melhores resultados e a crescer cada vez mais.

282 visualizações0 comentário