Séries temporais referem-se a conjuntos de dados que são coletados, registrados ou observados ao longo do tempo. Esses dados são organizados em uma sequência cronológica, onde cada ponto de dados está associado a um momento específico no tempo, de forma periódica e constante.
Essa organização permite que os pontos sejam estabelecidos de forma equidistante em gráficos – em intervalos denominados frequências de série – facilitando o estabelecimento de uma correlação entre cada análise.
Os gráficos temporais geralmente funcionam a partir de dois eixos (X, Y) e representam a variação de algum valor de acordo com o tempo analisado.
Dessa forma, é possível criar uma base confiável de padronização de algum comportamento, que pode ser de movimentação, demanda ou valor, por exemplo.
Série temporal representando os novos óbitos por COVID-19 no Brasil durante os meses de Janeiro/2020 á Maio/2021
Identificar padrões não aleatórios de uma variavel de interesse, nos permite fazer previsões orientadas a tomada de decisões. Como no exemplo acima vemos que há uma tendência crescente no numero de mortes, fornecendo uma variedade de insights cruciais para compreender a dinâmica da pandemia durante o periodo de analise e permitindo previsões para periodos posteriores.
Desvendando os Múltiplos Usos das Séries Temporais
As séries temporais são ferramentas versáteis e poderosas, com aplicações abrangentes em diversas áreas. Neste post, vamos explorar alguns dos inúmeros usos potenciais dessas séries, ilustrando a sua importância e relevância no mundo atual.
Previsão do Mercado de Ações
Em previsão e planejamento, são fundamentais para antecipar valores futuros, como na previsão econômica. São usadas para prever o movimento dos preços das ações. Os analistas usam os dados históricos do preço das ações para prever o preço futuro.
No meio econômico, esse estudo tende a ser usado para indicar PCIs (índice de preço do consumidor), taxas de desemprego, precificação e até mesmo PIBs.
Meteorologia
As séries temporais também são usadas na previsão do tempo. Os dados meteorológicos coletados ao longo do tempo são usados para prever o clima futuro. Por exemplo, o Instituto Nacional de Meteorologia do Brasil coleta uma série de dados meteorológicos que podem ser usados para analisar e prever padrões climáticos.
Otimização de Recursos
Em setores como manufatura e logística, as séries temporais podem ser usadas para otimizar o uso de recursos, como gestão de estoque, agendamento de produção e distribuição.
Existem muitos outros tipos de situações em que as séries temporais podem ser usadas, e como podemos perceber, elas podem ajudar não somente empresas, mas também podem ser uma ferramenta muito importante para identificação de padrões climáticos que se repetem, como o El Niño e El Niña, que podem ser identificados e previstos com séries temporais.
Componentes de séries temporais
Tendência
Uma tendência é um padrão de dados que mostra o movimento de uma série temporal durante o longo período de tempo. Em outras palavras é observada quando há ascendência ou descendência na série temporal. Às vezes, nos referiremos a uma tendência como “mudança de direção”, quando ela pode passar de uma tendência crescente para uma tendência decrescente.
Uma tendência pode ser:
- Tendência de alta ou ascendente: a análise da série temporal mostra um padrão geral ascendente e, em seguida, é a tendência de alta.
- Tendência de baixa ou descendente: a análise de série temporal mostra um padrão que é de baixa e, em seguida, é de tendência de baixa.
- Tendência horizontal ou estacionária: se nenhum padrão for observado, é chamado de tendência horizontal ou estacionária.
É possível encontrar tendências nos dados simplesmente visualizando um gráfico derivado da série ou pelo conjunto de dados em decomposição.
Sazonalidade
Uma série temporal é considerada sazonal quando os fenômenos que ocorrem durante a série se repetem a cada período idêntico de tempo. O conceito de sazonalidade acaba sendo intuitivo, mesmo sem nunca ter estudado esse assunto a fundo.
Podemos ter a nítida sensação de que alguns produtos vendem mais em determinados períodos como, por exemplo, roupas de lã durante os meses de outono e inverno. E já outros produtos, como picolés, sofrem quedas de venda nesses mesmos períodos.
Um padrão sazonal ocorre quando uma série temporal é afetada por fatores sazonais, como a época do ano ou o dia da semana. A sazonalidade de uma série temporal é sempre de um período fixo e conhecido. Para algumas séries temporais, pode haver mais de um componente sazonal, correspondendo aos diferentes períodos sazonais.
Estacionariedade
A estacionariedade em séries temporais é uma propriedade importante que descreve o comportamento estatístico de uma série ao longo do tempo. Uma série temporal é considerada estacionária quando suas propriedades estatísticas não mudam com o tempo. Existem duas principais características de estacionariedade: Média constante e Variância constante.
A estacionariedade é desejável ao analisar séries temporais porque muitos métodos estatísticos e modelos de previsão assumem que as propriedades estatísticas dos dados não mudam com o tempo. Se uma série não for estacionária, pode ser necessário aplicar técnicas de transformação, como diferenciação, para torná-la estacionária antes de aplicar métodos de modelagem.
É importante notar que existem diferentes tipos de estacionariedade, como estacionariedade estrita (quando todas as propriedades estatísticas, incluindo a distribuição conjunta, são constantes ao longo do tempo) e estacionariedade em sentido amplo (quando apenas a média e a variância são constantes). A análise de estacionariedade é fundamental para garantir a adequação de modelos estatísticos e para obter previsões precisas em séries temporais.
Ciclo e o Resíduo
Um ciclo ocorre quando os dados exibem aumentos e quedas que não são de uma frequência fixa, ou seja, não podem ser categorizados como sazonais ou de tendências. Quando uma série temporal é decomposta, geralmente combinamos a tendência e o ciclo em um único componente de ciclo de tendência.
Uma série temporal pode ser separada em três componentes básicos: um componente de ciclo de tendência, um componente sazonal e um componente restante/termo de erro, no qual o último representa qualquer outra coisa na série temporal, além dos outros componentes.
Diferenciação e Decomposição
A decomposição é o que separa a série temporal em componentes de tendência lineares, componentes sazonais e o erro. A decomposição é um procedimento usado para prever situações onde existe um componente sazonal na série ou para examinar a natureza dos componentes de uma série temporal.
A diferenciação, por outro lado, é usada para remover as tendências, mas a desvantagem de seu uso é que ela, por si só, não produz uma do estacionário de Yt. A primeira diferença aplicada a uma série temporal elimina uma tendência linear. Uma segunda diferença, isto é, a diferença da primeira diferença, pode eliminar uma tendência quadrática e assim por diante.
As séries diferenciadas normalmente não contém o ciclo de sazonalidade longo, que é observável nas séries selecionadas. Mas, por outro lado, as séries diferenciadas podem exibir um ciclo que foi obscurecido nos dados originais graças a natureza dos dados. Frequentemente, há distúrbios óbvios que podem contribuir para o comportamento não-estacionário e não-linear das séries temporais. Em tais casos, transformações como a diferenciação podem ser úteis para equalizar a variabilidade ao longo do comprimento de uma única série.
Os tipos de Séries Temporais
Previsão
Séries temporais de previsão referem-se à análise de conjuntos de dados organizados cronologicamente para antecipar valores futuros. Essas séries são aplicadas em uma variedade de contextos, como economia, finanças, saúde e meteorologia, onde a compreensão de padrões passados permite a construção de modelos para prever tendências e comportamentos futuros.
Classificação
Séries temporais de classificação envolvem a análise de dados organizados temporalmente com o objetivo de atribuir rótulos ou categorias a cada ponto de tempo. Esse tipo de análise é valioso em cenários onde as relações temporais são cruciais para a tomada de decisões. Um exemplo comum é a classificação de eventos ao longo do tempo, como detecção de falhas em sistemas, previsão de eventos climáticos específicos ou identificação de padrões de comportamento em dados sequenciais.
Clustering
Séries temporais de clustering envolvem a aplicação de técnicas de agrupamento (clustering) em conjuntos de dados organizados cronologicamente. O objetivo é identificar padrões ou grupos similares de comportamento ao longo do tempo. Essa abordagem é valiosa em cenários onde as relações temporais são cruciais para a análise, como na segmentação de séries temporais para entender diferentes regimes ou comportamentos ao longo de períodos específicos.
Nesse projeto desenvolvido pelo grupo no Google Colab para demonstração da análise de Séries Temporais, fazendo uso de ferramentas do Scikit-Learn, statsmodels, keras e Matplotlib para visualização de gráficos, foi feita a análise de uma base de dados que continha informações referentes ao numero de casos de Covid-19 durante um certo período de tempo. Durante esse processo de análise, a série temporal representada nessa base foi decomposta (em tendências, sazonalidades e resíduos) para melhor visualização.
Feito isso, foi criado um simples modelo de RNN (Rede Neural Recorrente) e utilizamos a base de dados mencionada para treina-lo. Por fim, após o fim do treinamento e ajuste dos hiperparâmetros do modelo, utilizamos outra parte da base de dados para valida-lo e o resultado pode ser visualizado na imagem logo abaixo.
Para visualização completa do código, em Python, responsável pelos dados gerados, segue o link abaixo
>> ACESSE AQUI O MODELO <<
Referências Bibliográficas
Introdução à Análise de Séries Temporais e Previsão
MONTGOMERY, Douglas C.; JENNINGS, Cheryl L.; KULAHCI, Murat. Introdução à Análise de Séries Temporais e Previsão. 2008. Wiley.
Análise de Séries Temporais
LEG, UFPR. Título do documento. Disponível em: http://leg.ufpr.br/~lucambio/CE017/20202S/ST03.pdf. Acesso em: 23, Novembro de 2023.
Séries Temporais: Tipos de Sazonalidade
Alura. Séries Temporais: Tipos de Sazonalidade. Disponível em: https://www.alura.com.br/artigos/series-temporais-tipos-de-sazonalidade. Acesso em: 23, Novembro de 2023.
Séries temporais: o que são e 3 aplicações principais
Escola de Jurisdição Financeira da FGV (EJFGV). Séries Temporais. Disponível em: https://ejfgv.com/series-temporais/. Acesso em: 25, Novembro e 2023.
Estacionaridade de séries temporais
ESTACIONARIEDADE DE SÉRIES TEMPORAIS. [S. l.], 7 jul. 2023. Disponível em: https://acervolima.com/o-que-e-uma-tendencia-em-series-temporais/. Acesso em: 25 nov. 2023.
O que é uma tendência em séries temporais?
O QUE É UMA TENDÊNCIA EM SÉRIES TEMPORAIS?. [S. l.], 2022. Disponível em: https://acervolima.com/o-que-e-uma-tendencia-em-series-temporais/. Acesso em: 25 novembro de 2023.
Métodos para análise de séries temporais
Minitab. Métodos para análise de séries temporais. Disponível em: <https://support.minitab.com/pt-br/minitab/21/help-and-how-to/statistical-modeling/time-series/supporting-topics/basics/methods-for-analyzing-time-series/\>. Acesso em: 25 de novembro de 2023.
SCIKIT-LEARN
SCIKIT-LEARN. Documentação do scikit-learn. Disponível em: https://scikit-learn.org/stable/index.html. Acesso em: 25 de novembro de 2023.
STATSMODELS
STATSMODELS. Documentação do statsmodels. Disponível em: https://www.statsmodels.org/stable/index.html. Acesso em: 25 de novembro de 2023.
KERAS
KERAS. Documentação do Keras. Disponível em: https://keras.io/api/. Acesso em: 25 de novembro de 2023.
MATPLOTLIB
MATPLOTLIB. Documentação do Matplotlib. Disponível em: https://matplotlib.org/stable/users/index.html. Acesso em: 25 de novembro de 2023.
TENSORFLOW
TENSORFLOW. Documentação do TensorFlow. Disponível em: https://www.tensorflow.org/?hl=pt-br. Acesso em: 25 de novembro de 2023.
Autores
Gustavo Rocha Vaz (173218)
Igor Paulo dos Santos Santana (198643)
Nathalia Vitória Soares Rodrigues (222841)
Clara Luiza De Andrade Klippel (234458)