Au cours des dernières années, les séries temporelles à valeurs entières ont suscité un intérêt croissant, avec des applications dans de nombreux domaines scientifiques, par exemple, l’économie et la finance (voir par exemple Blundell et al., 2002, Quoreshi, 2006, Jung & Tremayne, 2011a, Jung & Tremayne, 2011b et Christou & Fokianos, 2014), les sciences sociales (voir par exemple McCabe & Martin, 2005, Pedeli & Karlis, 2011 et Liu, 2012), la télécommunication (voir par exemple Lambert & Liu, 2006), le tourisme (voir par exemple Brännäs & Nordström, 2006, Garcia-Ferrer & Queralt, 1997 et Brännäs et al., 2002) et l’environnement (voir par exemple Thyregod et al., 1999, Cui & Lund, 2009, Boudreault & Charpentier, 2011 et Scotto et al., 2014). En général, les séries temporelles à valeurs entières surviennent quand on s’intéresse au nombre des occurrences d’un événement particulier dans un intervalle de temps spécifié. Plusieurs modèles ont été proposés dans la littérature pour modéliser ce type des séries.
Ces modèles sont classifiés par Cox et al. (1981) en deux catégories principales : les modèles « parameter-driven » (pour lesquels le paramètre d’intérêt dépend d’un processus latent) et les modèles « observation-driven » (pour lesquels le paramètre d’intérêt ne dépend que des observations). Une des premières approches proposées est le modèle INAR(1) (INteger-valued AutoRegressive) introduit par McKenzie (1985) et Al-Osh & Alzaid (1987). Ce modèle utilise l’opérateur d’amincissement introduit par Steutel et al. (1979). Le modèle INAR appartient à la classe des modèles « parameter-driven » et représente un cas particulier de processus de branchement avec une immigration. La généralisation de ce modèle à l’ordre supérieur à un (i.e. INAR(p)) est établie par Alzaid & Al-Osh (1990) qui ont aussi étudié sa structure d’autocorrélation.
L’étude par simulations de Al-Osh & Alzaid (1987) a montré que l’estimateur des moindres carrés conditionnels, et l’estimateur de Yule-Walker ne sont pas efficaces pour le modèle INAR(1) quand la distribution marginale de l’innovation est Poisson. Par ailleurs, l’estimateur du maximum de vraisemblance (EMV) est difficile à calculer, notamment lorsque l’ordre du modèle est grand. Ce problème a incité certains auteurs à proposer des techniques et algorithmes alternatifs pour estimer ce modèle (voir par exemple Pavlopoulos & Karlis, 2008, Drost et al., 2009 et Pedeli et al., 2014).
Un autre modèle populaire est le modèle INGARCH(p, q) (INteger-valued Generalized AutoRegressive Conditional Heteroscedastic) qui a été introduit par Ferland et al. (2006). Il est aussi appelé ACP (Autoregressive Conditional Poisson) dans Heinen (2003). Le modèle INGARCH(p, q) est classifié comme un modèle « observationdriven ». Il est obtenu en supposant que la distribution conditionnelle de la série sachant le passé est Poisson avec un paramètre d’intensité d’une forme linéaire expliquant la dynamique du modèle. Ce modèle ne peut convenir que pour les séries sur-dispersées ( i.e. lorsque la variance inconditionnelle est supérieure à l’espérance inconditionnelle). Christou & Fokianos (2014) ont étudié le modèle INGARCH(1,1) quand la distribution conditionnelle est binomiale négative. Heinen (2003) et Zhu (2012a) ont proposé d’utiliser respectivement la distribution double Poisson de Efron (1986) et la distribution de Poisson-généralisée pour que ce modèle puisse être compatible avec la sous-dispersion (i.e. lorsque la variance inconditionnelle est inférieure à l’espérance inconditionnelle). Le lecteur est renvoyé à Kokonendji (2014) pour une revue générale des modèles de séries temporelles à valeurs entières sous et surdispersées. Gonçalves et al. (2015b) ont établi la stationnarité et l’ergodicité des modèles INGARCH(p, q) dont la distribution conditionnelle appartient à la famille des distributions de Poisson composées, qui comprend, comme cas particuliers, plusieurs distributions ( par exemple la distribution de Poisson, la distribution binomiale négative et la distribution de Poisson généralisée). Fokianos & Tjøstheim (2011) ont introduit le modèle log-linéaire. Au contraire du modèle INGARCH dont les paramètres autorégressifs de la moyenne conditionnelle sont positivement contraints, les paramètres du modèle log-linéaire ne sont pas contraints à être positifs, ce qui rend le modèle capable de modéliser les séries ayant une autocorrélation négative.
Par ailleurs ce modèle permet d’ajouter des variables explicatives exogènes à la moyenne conditionnelle. Motivé par le phénomène de zéro-inflation (i.e. la proportion des zéros est plus grande que la proportion des zéros du modèle Poisson INGARCH) qui est commun dans les séries temporelles à valeurs entières, Zhu (2012c) a introduit les modèles zéro-inflation Poisson et zéro-inflation négatif binomial INGARCH. Récemment, Gonçalves et al. (2016) ont proposé le modèle INGARCH de Poisson composé avec une zéro-inflation qui représente une classe générale, et qui comprend les modèles zéro-inflation Poisson et zéro-inflation négatif binomial INGARCH comme cas particuliers. D’autres spécifications des modèles de moyennes conditionnelles sont disponibles dans la littérature (voir par exemple Gao et al., 2009, Fokianos & Tjøstheim, 2012, Zhu, 2012b, Christou, 2014 et Gonçalves et al., 2015a).
En ce qui concerne les tests d’adéquation de l’ajustement des modèles de séries temporelles à valeurs entières, la littérature est ténue. Notons cependant, la contribution de Zhu & Wang (2010), qui ont étudié un ensemble de tests pour l’adéquation de l’ajustement du modèle INARCH(p) de Poisson. Certains de ces tests ne prennent pas en compte l’influence des erreurs d’estimation des paramètres affectant la robustesse des tests, en particulier lorsque les valeurs des paramètres sont relativement grandes. D’autres tests dépendent de paramètres arbitraires. Neumann (2011) a proposé d’utiliser l’hypothèse de l’équi-dispersion conditionnelle du modèle INGARCH(p, q) de Poisson pour tester l’adéquation de la spécification du processus de l’intensité. En outre, Fokianos & Neumann (2013) ont présenté un test non paramétrique pour le modèle INGARCH(p, q) de Poisson. Récemment, Meintanis & Karlis (2014) ont proposé un test de qualité de l’ajustement pour la distribution de l’innovation du modèle INAR(1) de Poisson. Hudecová et al. (2015) ont introduit un test de qualité de l’ajustement fondé sur la fonction génératrice des probabilités pour le modèle INAR(p) de Poisson et le modèle INARCH(p) de Poisson. De plus, Schweer (2016) a introduit un test plus général dans lequel la fonction génératrice conjointe des probabilités empirique est considérée pour tester l’adéquation de l’ajustement d’une large classe de modèles de séries temporelles à valeurs entières, mais ce test dépend de paramètres arbitraires. En outre, la généralisation de la méthodologie de ce test à modèles d’ordre supérieur est difficile.
La littérature sur les séries temporelles multivariées à valeurs entières est moins développée. Une contribution importante est due à Franke & Subba Rao (1993) qui ont introduit le modèle M-INAR(1) (Multivariate INteger-valued AutoRegressive). Latour (1997) a étudié le modèle M-INAR quand l’ordre est supérieur à un. Récemment, Pedeli & Karlis (2011) ont introduit le modèle INAR bivarié d’ordre un dans lequel les innovations sont supposées suivre conjointement la distribution de Poisson bivariée ou la distribution binomiale négative bivariée. Ce modèle peut seulement modéliser les séries dont la corrélation croisée instantanée est positive. Un modèle INAR bivarié plus flexible a été introduit par Karlis & Pedeli (2013). Dans ce modèle, la distribution marginale de chaque innovation est Poisson univariée ou binomiale négative univariée, et les deux innovations sont supposées être connectées par une copule bivariée (voir Sklar, 1959 et Nelsen, 2006). Heinen & Rengifo (2007) ont introduit le modèle INGARCH multivarié avec copule. Ce modèle est obtenu en supposant que la distribution conditionnelle de chaque série est double-Poisson. La dépendance entre les séries est modélisée en utilisant une copule gaussienne multivariée. Ce modèle peut accueillir la corrélation croisée instantanée négative et positive entre les séries. De plus, il peut modéliser les séries sous-dispersées et les séries sur dispersées. Liu (2012) a proposé le modèle INGARCH(p, q) bivarié pour les séries sur-dispersées ayant une corrélation croisée instantanée positive. Le modèle est obtenu en supposant que la distribution conditionnelle est Poisson bivarié.
|
Table des matières
Remerciements
Résumé
Abstract
Liste des tableaux
Table des figures
1 Le contexte bibliographique et les contributions de la thèse
1.1 Introduction
1.2 Résultats du chapitre 2
1.3 Résultats du chapitre 3
1.4 Résultats du chapitre 4
Références
2 Poisson QMLE of count time series models
2.1 Introduction
2.2 Asymptotic distribution of the Poisson QMLE
2.2.1 Consistency of the PQMLE
2.2.2 Asymptotic distribution
2.2.2.1 When θ0 belongs to the interior of Θ
2.2.2.2 When θ0 belongs to the boundary of Θ
2.3 Application to particular models
2.3.1 Poisson INGARCH model
2.3.2 Negative binomial INGARCH model
2.3.3 Double-Poisson INGARCH model (DACP model)
2.3.4 Generalized Poisson INGARCH model
2.3.5 COM Poisson INGARCH model
2.3.6 Log-linear models
2.3.7 INAR
2.4 Numerical illustrations
2.4.1 Finite sample behaviour of the PQMLE
2.4.2 Significance tests based on the PQMLE
2.4.2.1 Empirical behavior of the tests under the null
2.4.2.2 Empirical behavior of the tests under the alternative
2.5 Real data application
2.6 Proofs
2.7 Conclusion
References
Appendix
3 Portmanteau test for count time series models
3.1 Introduction
3.2 Model and assumptions
3.3 Portmanteau test
3.4 Numerical illustrations
3.5 Real data application
3.6 Proofs
3.7 Conclusion
References
Appendix
4 Poisson QMLE of multivariate count time series models
4.1 Introduction
4.2 Model and main results .
4.2.1 Other technical assumptions
4.3 Applications to particular models
4.3.1 Multivariate INAR model
4.3.2 Bivariate Poisson INGARCH model
4.3.3 Copulas-based multivariate INGARCH models
4.4 Numerical illustrations
4.4.1 Finite sample behaviour of EbE-PQMLE
4.4.2 Finite sample comparison between EbE-PQMLE and MLE
4.5 Real data application
4.6 Proofs
4.6.1 Proofs of Theorem 4.2.1 and Theorem 4.2.2
4.6.2 Proof of Theorem 4.2.3
4.7 Conclusion
References
Appendix
5 Conclusion générale
Télécharger le rapport complet