Introduction
La neurobiologie des rythmes
Présentation de l’institut des neurosciences cellulaires et intégratives
Les recherches en neurosciences sont devenues une priorité actuellement, étant donné le nombre croissant de patients atteints de maladies du cerveau, ceci étant lié notamment à l’augmentation de l’espérance de vie.
L’INCI, l’institut des neurosciences cellulaires et intégratives, est un institut de recherche qui se concentre sur trois thèmes majeurs, qui sont les rythmes biologiques, la neurosécrétion et la nociception.
L’institut se divise ainsi en trois départements : Neurobiologie des fonctions rythmiques Physiologie des réseaux neuronaux Nociception et douleur
La nociception est une fonction défensive, permettant l’intégration au niveau du système nerveux central d’un stimulus douloureux via l’activation des nocicepteurs (récepteurs à la douleur) cutanés, musculaires et articulaires.
La physiologie des réseaux neuronaux s’intéresse aux phénomènes de libération par les neurones de molécules informatives destinées à la communication avec d’autres cellules.
Il a déjà été démontré que la rétine contenait une horloge biologique interne, c’est-à-dire un ensemble de gènes qui s’expriment en boucle de manière autonome, induisant sur une période de 24h environ leur propre expression oscillatoire ainsi que celle de nombreux autres gènes qui contrôlent la physiologie de la rétine. Le travail de thèse de C. Jaeger consiste à répondre à plusieurs questions concernant cette horloge locale :
-L’horloge biologique de la rétine se situe-t-elle dans une couche de la rétine ou dans toutes les couches ?
– Comment les différentes couches communiquent-elles entre-elles pour se transmettre les informations rythmiques ?
Le modèle biologique utilisé est une souris transgénique créée pour exprimer un rapporteur visible du fonctionnement de l’horloge biologique : la luciférase, présente dans les cellules de l’animal suite à la modific ation génétique, catalyse une réaction chimique bioluminescente et ainsi, les variations de la bioluminescence émise par les cellules reflètent les variations oscillatoires de l’un des gènes de l’horloge biologique, appelé Per2.
Application à un échantillon
Voici un exemple pour un échantillon PR ( couche des photorécepteurs)
On a vérifié que les résidus étaient distribués selon une loi normale par un test de Shapiro-Wilk. Pour vérifier l’homoscédasticité des résidus, on a utilisé un test de Bartlett.
On a également fait apparaitre les matrices de corrélations afin d’identifier les paramètres qui étaient liés entre eux.
On a effectué des tests de Durbin-Watson pour vérifier l’indépendance entre les données, cependant ces derniers aboutissaient parfois à la conclusion qu’il y avait un lien entre différents enregistrements.
Il aurait fallu supprimer des données pour que les tests donnent des résultats satisfaisants. Or, cela aurait induit une perte de données inacceptable pour les biologistes. On n’en a donc pas tenu compte,bien qu’en toute rigueur il faille vérifier l’indépendance.
On va prendre l’exemple de l’échantillon 21A_PR3 appartenant au groupe PRL (cellules photo récepteur).
On a effectué un ajustement à l’aide de la fonction « nls » de R ( non linear square).
On a tenu compte du fait qu’on a d’excellents indicateurs pour l’ensemble des régressions. On a en effet des valeurs très élevées de R² et de F (les résultats sont donnés en annexe). On n’a que très rarement des valeurs de coefficient de détermination inférieures à 0.90 et les valeurs de F sont presque toujours supérieurs à 100, parfois même supérieures à 1000. On constate graphiquement que les ajustements sont très bons et on considère donc que les régressions peuvent être validées.
Outre le phénomène d’hétéroscédasticité des résidus observé sur bon nombre d’échantillons, le diagnostique des régressions révèle un autre problème : celui des valeurs trop élevées des facteurs d’inflation de la variance(VIF).Les VIF ont été obtenus avec sigmaplot. Pour l’échantillon 21A_PR3,on obtient le tableau suivant.
Il a été déterminé de manière empirique pour un modèle à beaucoup de paramètres qu’un VIF supérieur à 10 était révélateur de multicolinéarité entre ces derniers.
Le VIF indique l’inflation de la variance des coefficients en présence de multicolinéarité.
Un facteur d’inflation de la variance trop élevé révèle une régression « instable ». Le moindre changement au niveau des paramètres (suppression ou ajout) modifie de manière excessive les estimations précédemment effectuées. De plus, certains paramètres peuvent être estimés avec un signe opposé à celui auquel on s’attendait. En résumé, les VIFs trop élevés sont révélateurs d’une régression à laquelle on ne peut pas se fier. Il convient donc d’éliminer des paramètres.
Choisir un nombre élevé de paramètre pour décrire le modèle permet de l’approcher de manière plus fine, au détriment de la précision de l’estimation de ceux-ci.
Il faut se limiter à des paramètres correspondant aux aspects essentiels du phénomène pour l’étude en cours.
Il va donc falloir éliminer les paramètres responsables du phénomène de multicolinéaité.
Matrice de corrélations entre les paramètres
Dans un premier temps, on cherche à les identifier grâce à la matrice de corrélation qu’on obtient en utilisant la fonction « gnls » de R, présente dans la librairie « nlme », obtenue grâce à la fonction « library » de R. Toujours dans le cas du même échantillon, on obtient la matrice de corrélation suivante.
Elimination des paramètres responsables de la multicolinéarité
L’objectif de cette étape était d’obtenir une équation simplifiée qui conviendrait à toutes les régressions, c’est-à-dire qui permettrait d’obtenir un bon ajustement, donc de bons indicateurs de régression ( un F et un R² élevés) tout en diminuant la colinéarité entre les paramètres et donc en diminuant la valeur des VIF . Choisir un nombre élevé de paramètres pour décrire le modèle permet de l’approcher de manière plus fine, au détriment de la précision de l’estimation des paramètres. Il convient de se limiter aux paramètres correspondant aux aspects essentiels de l’étude en cours.
On a abordé ce problème de trois manières différentes. Dans un premier temps, on a supprimé des paramètres de manière aléatoire par le procédé suivant.
On a supprimé le paramètre qui était le plus responsable de la colinéarité, puis dans la nouvelle équation, on a recommencé le même procédé, jusqu’à l’obtention d’une équation optimale.
On a obtenu l’équation suivante :
Dans cet exemple, tous les paramètres ont un apport significatif. Ceci était prévisible aux vues des valeurs des statistiques t de Student dans la régression. Tous les paramètres étaient significativement différents de zéro.
S’il y avait eu un paramètre non significatif, on l’aurait supprimé et on aurait recommencé le même procédé sur la nouvelle équation obtenue, et ceci jusqu’à l’obtention d’un modèle dont tous les paramètres sont significatifs.
Tau a toujours un apport significatif, aussi ne l’a-t-on ôté pour aucune régression. Ceci nous arrange car l’étude porte sur la valeur de l’estimation du paramètre tau.
Après avoir éliminé les paramètres superflus de l’équation pour les 120 régressions à l’aide d’une régression descendante, on a fait de même à l’aide d’une régression ascendante et on a constaté qu’on n’obtenait pas toujours la même équation. On a donc gardé celle qui garantissait les valeurs de F et de R² les plus élevées et les valeurs de VIF les plus basses. Pour la méthode ascendante, on introduit les paramètres un à un. On commence par un modèle à un paramètre et on introduit les autres paramètres un à un. On introduit à chaque pas le paramètre susceptible d’augmenter le plus la somme des carrés du modèle. Donc, le paramètre introduit en premier est celui qui possède la plus grande valeur de F et qui est significatif avec une probabilité par défaut associée au F de 0.5. Ce seuil s’appelle le seuil « pour entrer ».
On a constaté que malgré l’élimination d’un certain nombre de paramètres, les valeurs des VIF demeuraient trop élevées pour la plupart d’entre eux. Malgré tout, il faut faire attention à ne pas trop en supprimer. En effet, bien que la suppression de ceux-ci induise la diminution de la valeur des VIF, elle provoque également une perte d’information d’un point de vue biologique. Il faut donc concilier les exigences des domaines mathématiques et biologiques afin d’obtenir des résultats optimaux. Enfin, il faut tenir compte du fait que ces méthodes de régressions ne donnent pas nécessairement le meilleur modèle. Elle ne sont donc pas entièrement fiables.
Eliminer des paramètres a permis d’améliorer la statistique du test de Bartlett pour certaines régressions. Les anciens résultats ainsi que les nouveaux sont donnés en annexe.
Calcul des nouvelles périodes
On a désormais éliminé tous les paramètres superflus. Pour chaque échantillon, on a établi une nouvelle équation. On a donc de nouvelles estimations du paramètre « Tau ». Il faut alors recalculer les valeurs de la période dans chacun des 120 échantillons.
On a donc pris en compte les nouvelles estimations de « Tau », et on les a multipliées par 24 pour que la période soit exprimée en jours.
Prenons l’exemple de l’échantillon 19A.INL2. On a obtenu une nouvelle équation par la méthode de la régression descendante. Avant, on obtenait une estimation pour les 8 paramètres pour l’équation
Recherche d’une période commune au sein de chaque groupe
L’objectif de cette partie est de mettre en évidence l’existence d’une période homogène entre les différents échantillons d’un même groupe, c’est-à-dire que les périodes observées sont globalement assez proche pour qu’on considère que le groupe est cohérent. Pour vérifier cela, on veut montrer qu’on peut, pour chaque groupe, ajuster une période unique.
Les cellules noires indiquent des comparaisons qu’il est inutile de réaliser.
Il y a 18 comparaisons à effectuer. On peut réduire ce nombre si les périodes des groupes GCL, PRL et INL ne sont pas significativement différentes. On pourra former un seul groupe à partir de ces trois groupes et le comparer à d’autres groupes, plutôt que de comparer chacun de ces trois groupes individuellement.
On aimerait réaliser ces comparaisons par le biais d’ANOVAs, mais il s’avère que chaque période est obtenue avec une erreur type (voir annexe). Il faudrait donc montrer que les erreurs sont négligeables pour chaque échantillon, afin de pouvoir considérer que la valeur depériode obtenue est la valeur exacte.
On a déjà démontré que les périodes étaient homogènes au sein d’un même groupe. Ainsi, si à l’issue du test on conclut à la conservation de l’hypothèse , on saura qu’il y a une différence significative entre les périodes des deux groupes comparés.
On a commencé par comparer les résultats obtenus avec la régression générale avec ceux obtenus par l’ANOVA sur les périodes des groupes faite en négligeant les erreurs type. On a comparé les groupes GCL et INL On obtient les résultats suivants :
Avec une régression générale
On regroupe les données des échantillons GCL et INL et on teste l’hypothèse citée ci dessus contre l’hypothèse citée ci-dessus .
Conclusion
Le but de l’étude était de déterminer où se situait l’horloge biologique de la rétine.
Dans un premier temps, on a isolé les différentes couches de la rétine afin d’étudier leur comportement.
Les couches GCL INL et PRL ont toutes les trois une période similaire, cependant leur période est différente de celle de la rétine entière. Elle est plus importante.
Les couches gardent donc une activité, même lorsqu’elles sont isolées les unes des autres, cependant leur période est différente de celles qu’elles ont lorsqu’elles forment la rétineentière.
Ensuite, on a recollée les couches de la rétine afin de voir si la nature de leur communication avait changé. On a également crée les groupes GCL+INL et PRL+INL en ôtant respectivement les couches PRL et GCL de la rétine.
Les couches GCL PRL et INL séparées ont une période différente de celle des cellules dissociées.
La rétine entière a une période différente de celle du groupe où l’on a ôté la couche PRL et de celle du groupe où l’on a ôté la couche GCL
Le groupe GCL+INL a une période différente de celle du groupe GCL INL
En revanche, le groupe PRL+INL a une période comparable à celle du groupe PRL INL. On n’a pas encore trouvé d’explication à ceci.
La période est modulée par le degré de couplage entre les oscillateurs et les cellules.
Ces analyses permettront à C.Jaeger de tirer des conclusions plus fines sur la situation de l’horloge dans la rétine et sur la nature de la communication entre les couches.
|
Table des matières
Remerciements
I) Introduction
1°) Neurobiologie des rythmes
a) Présentation de l’institut des neurosciences cellulaires et intégratives
b) Présentation du sujet de stage
2°) La régression non linéaire et l’algorithme de Gauss-Newton
a) La régression non linéaire
b) Estimation de paramètres
c) Algorithme de Gauss-Newton
II) Ajustements de nos données par des régressions non-linéaires et validations des modèles
1°) Application à un échantillon
a) Vérification de la normalité et de l’homoscédasticité des résidus
b) Estimation des paramètres
c) Matrice de corrélations entre les paramètres
III) Elimination des paramètres responsables de la multicolinéarité
IV) Calcul des nouvelles périodes
V) Recherche d’une période commune au sein de chaque groupe
1°) Présentation de la méthode
2°) Recherche d’une période commune pour les échantillons du groupe CoGC+INL
VI) Comparaison entre les groupes
1°) Avec une régression générale
2°) Avec la fonction « aov » de R
3°) Présentation d’une méthode permettant de négliger les erreurs associées à la période
4°) Résultats des ANOVA
VII) Conclusion
ANNEXE