Journal de pharmacie et de recherche pharmaceutique Libre accès

Abstrait

Approches bioinformatiques et statistiques pour les données LC-MS à haut débit

Aneta Sawikowska

Des analyses complètes de données pour les données LC-MS à haut débit sont présentées. Des méthodes d'analyse statistique et d'intégration pour des expériences multifactorielles sont présentées. Des exemples d'ensembles de données proviennent d'études sur la réponse des céréales à l'infection par des agents pathogènes et de l'orge (Hordeum vulgare) sous stress de sécheresse. Les métabolites primaires, les métabolites secondaires et les protéines ont été analysés.

Le prétraitement, l'analyse et la visualisation des données ont été réalisés dans le système R. Les analyses statistiques ont été réalisées à l'aide des procédures du package Genstat. Des méthodes d'intégration et de visualisation de données omiques par réseaux sont présentées.

Les réseaux de corrélation et les réseaux de corrélation différentielle ont été construits pour comparer les relations entre les métabolites et les protéines dans différentes conditions. Les traits sont représentés par des nœuds, les lignes (arêtes) correspondent aux corrélations entre les paires de traits. Les modules - les clusters avec des traits fortement corrélés sont détectés. Les hubs, qui sont des traits avec de nombreuses connexions (corrélations avec d'autres traits) sont indiqués.

L'analyse du réseau de corrélation a été réalisée à l'aide du package WGCNA dans R, la matrice de corrélation de Pearson a été transformée en matrice d'adjacence à l'aide d'une fonction de puissance. Les modules ont été détectés par clustering. Les réseaux de corrélation différentiels ont été créés à l'aide du test basé sur la transformation Z de Fisher, avec correction de Bonferroni. La visualisation des réseaux a été réalisée dans Cytoscape.

Les algorithmes peuvent être adaptés à toutes les données LC-MS à haut débit.

Avertissement: test