V Uday Kumar Reddy, Rajashree Shettar et Vidya Niranjan
L'invention de nouvelles techniques informatiques comme le cloud computing et le grid computing a permis de réduire le coût des calculs grâce à un partage optimal des ressources. Pourtant, de nombreuses applications ne sont pas entièrement transférées vers ces nouvelles technologies, principalement en raison de la réticence des scientifiques à partager les données sur Internet pour des raisons de sécurité. Même si le coût du matériel a été considérablement réduit, peu d'applications nécessitent une puissance de traitement élevée pour traiter ou analyser d'énormes données scientifiques. En outre, en raison du coût élevé requis pour acquérir des ressources de calcul, de nombreuses applications scientifiques ne sont pas encore complètement concrétisées. L'une de ces applications est le séquençage de nouvelle génération (NGS), qui devra traiter des téraoctets de données génomiques, ce qui nécessitera une puissance de calcul élevée. Un superordinateur est donc nécessaire pour traiter efficacement les données.
Dans cet article, l'utilisation du middleware open source Berkeley Open Infrastructure for Network Computing (BOINC) a été proposée pour permettre l'assemblage de novo à l'aide d'un cluster de machines de bureau dans le paradigme maître et volontaire. Le paradigme peut être mis en place dans des laboratoires informatiques normaux qui éliminent à la fois les problèmes de bande passante et de sécurité liés à l'utilisation de méthodes de calcul en nuage et en grille sur Internet. Ce paradigme crée un superordinateur virtuel dans les laboratoires pour traiter les données.