Analyse computationnelle des éléments cis-régulateurs dans les génomes des drosophiles et des mammifères
Marc Santolini (LPS)

Infos Complémentaires

en salle de conférence E244 / Conf IV

jeudi 19 septembre 2013 à 15h

La différenciation cellulaire et la spécification des tissus
biologiques dépendent en partie de l’établissement de programmes
d’expression génétique caractéristiques. Ces programmes sont le
résultat de l’interprétation de l’information génomique par des
Facteurs de Transcription (TFs) se fixant à des séquences d’ADN
spécifiques. Décoder cette information dans les génomes séquencés est
donc un enjeu majeur.

Dans une première partie, nous étudions l’interaction entre les TFs et
leurs sites de fixation sur l’ADN. L’utilisation d’un modèle de Potts
inspiré de la physique des verres de spin et de données de fixation
à grande échelle pour plusieurs TFs de la drosophile et des mammifères
permet de montrer que les sites de fixation exhibent des corrélations
entre nucléotides. Leur prise en compte permet d’améliorer
significativement la prédiction des sites de fixations sur le génome.

Nous présentons ensuite Imogene, l’extension au cas des mammifères d’un
algorithme bayésien utilisant la phylogénie afin d’identifier les
motifs et modules de cis-régulation (CRMs) contrôlant l’expression d’un
ensemble de gènes co-régulés, qui a précédemment été appliqué au cas de
la régulation chez les drosophiles. Partant d’un ensemble
d’apprentissage constitué d’un petit nombre de CRMs chez une espèce de
référence, et sans connaissance \textita priori des TFs s’y fixant,
l’algorithme utilise la sur-représentation et la conservation des sites
de fixation chez des espèces proches pour prédire des régulateurs
putatifs ainsi que les CRMs génomiques sous-tendant la co-régulation.
Nous montrons en particulier qu’Imogene peut distinguer des modules de
régulation conduisant à différents motifs d’expression génétique sur la
seule base de leur séquence ADN.

Enfin, nous présentons des applications de ces outils de modélisation
à des cas biologiques réels : la différenciation des trichomes chez la
drosophile, et la différenciation musculaire chez la souris. Dans les
deux cas, les prédictions ont été validées expérimentalement en
collaboration avec des équipes de biologistes, et pointent vers une
grande flexibilité des processus de cis-régulation.

en salle de conférence E244 / Conf IV