Le Genoscope met les données génomiques à disposition des_MySQL
Créé en 1997, le Genoscope - Centre National de Séquençage - est un grand équipement au service de la communauté scientifique. Sa mission est d'acquérir, de "séquencer", et d'analyser l'information génétique de divers organismes d'intérêt scientifique, médical ou économique. Concrètement, le séquençage consiste à déterminer l'ordre dans lequel s'enchaînent les molécules élémentaires qui constituent les molécules d'ADN. Le Genoscope produit des données de nature diverse - séquences entières ou partielles de génomes ou de produits d'expression des gènes - qu'il compare et interprète. Après avoir été l'un des acteurs du projet génome humain, le Genoscope met aujourd'hui le cap vers la génomique environnementale. Depuis 2007, le Genoscope est intégré à l'institut de Génomique du CEA, le Commissariat à l'énergie atomique et aux énergies alternatives.
Défis
- Mettre un volume important de données scientifiques à disposition des biologistes du monde entier via une base de données alliant performance, portabilité et simplicité d’utilisation.
- Rapidement et simplement déployer de nouvelles applications de bases de données pour répondre aux besoins croissants d’analyse génomique.
Solution
- Le Genoscope a initialement utilisé Sybase comme base de données mais faisait face à plusieurs contraintes, notamment en termes de portabilité sur différentes plateformes ainsi que de simplicité d’utilisation et d’administration.
- Evaluation et sélection de MySQL comme nouveau standard de base de données pour répondre à ces contraintes.
- Environ 300 bases MySQL contenant 8 téraoctets de données sont déployées par l’institut à ce jour, incluant:
- 250 bases MySQL utilisées pour mettre les données génomiques à disposition de la communauté scientifique via des applications Web. Chaque application est dédiée à un type particulier de données, par exemple les "métagénomes" ou la comparaison de différents génomes. L’application la plus importante gère plus de 5 téraoctets de données, s’appuyant sur une trentaine de bases MySQL.
- Une cinquantaine de bases de données MySQL utilisées pour des applications d’informatique décisionnelle et de gestion de projets.
- Le Genoscope utilise MySQL 5.6 pour les nouvelles applications, ainsi que MySQL Workbench pour leur modélisation et développement. Sylvain Bonneval, DBA de l’équipe système, souligne "Outre la performance et la simplicité d’utilisation de MySQL, nous apprécions particulièrement le rythme des innovations délivrées par Oracle. MySQL 5.6 intègre de nombreuses nouvelles fonctionnalités très utiles et nous constatons à quel point MySQL est une base de données en pleine progression."
- MySQL Enterprise Edition a été mis en place pour permettre aux équipes de bénéficier de l’accès au support technique MySQL d’Oracle ainsi que des outils de monitoring comme le MySQL Enterprise Monitor et MySQL Query Analyzer.
"MySQL nous a permis de largement accroître l'usage des bases de données au sein de notre organisation. C’est un outil parfaitement adapté aux applications de recherche publique, tant par sa performance que par sa nature open source." Sylvain Bonneval, DBA, Le Genoscope