L'organisme de formation continue du CNRS
Accueil > Pipelines et méthodes bioinformatiques pour l'analyse de données de séquençage (NGS)

Formation - Pipelines et méthodes bioinformatiques pour l'analyse de données de séquençage (NGS)

Environnement scientifique et technique de la formation

Centre de recherche en informatique, signal et automatique de Lille

- UMR 9189
RESPONSABLE

Bastien CAZAUX

Maître de conférences

UMR 9189

LIEU

LILLE (59)

ORGANISATION

35 h
De 8 à 12 stagiaires

MÉTHODES PÉDAGOGIQUES

Tout au long de la formation, des exercices corrigés permettront au stagiaire d'évaluer l'acquisition des connaissances. Des fichiers au format PDF seront mis à disposition du stagiaire.

COÛT PÉDAGOGIQUE

2142 Euros

A L'ISSUE DE LA FORMATION

Evaluation de la formation par les stagiaires
Envoi d'une attestation de formation

DATE DU STAGE

25033 : du lundi 17/11/2025 au vendredi 21/11/2025 à LILLE

2025
Janvier Février Mars Avril
Mai Juin Juillet Août
Sept Oct Nov
25033
Déc
OBJECTIFS
-

Identifier les outils d'analyse en fonction du jeu de données


-

Analyser de manière autonome des données dans un gestionnaire de workflow comme Galaxy


-

Manipuler les fichiers de lecture de séquençage : extraction, préparation, filtrage/nettoyage


-

Evaluer la qualité des données de séquençage


-

Analyser des données de séquençage de génomes et de de RNA-seq (avec ou sans génome de référence) et prendre du recul sur le protocole expérimental

PUBLIC
Chercheurs, ingénieurs ou techniciens en biologie et santé
PRÉREQUIS
- Être familier avec le travail sur ordinateur (navigateur internet, traitement de texte)
- Connaissances de base sur le séquençage à haut débit
PROGRAMME
Jour 1 :
- Galaxy : utilisation d'un gestionnaire de workflow pour l'analyse de données
- Introduction aux données de séquençage et pré-traitements : évaluation qualité (FastQC, MultiQC), nettoyage (Cutadapt, TrimGalore)
- Mapping pour le DNA-seq (BWA, Bowtie2, formats SAM / BAM)

Jour 2 :
- Bases de la recherche de variants génomiques : Variant Calling (FreeBayes, format VCF), annotation
(SnpEff)

Jour 3 :
- Assemblage de génome, principes et usages : assemblage Short Reads et Long Reads (Spades, Megahit), évaluation qualité (Quast, KAT)

Jours 4 et 5 :
- Analyse RNA-seq : mapping (STAR, Hisat2), pseudo-mapping (Salmon), assemblage (Stringtie, Trinity), recherche de variants de novo (KisSplice), expression différentielle (DESeq2)
EQUIPEMENTS
Un ordinateur sera mis à la disposition de chaque stagiaire.
Les exercices pratiques de la formation se dérouleront entièrement dans le gestionnaire de workflow
Galaxy.
INTERVENANTS
C. Marchet, A. Limasset (chargés de recherche) et H. Touzet (directrice de recherche)
FORMATIONS SIMILAIRES