Actuel :

DMP Canvas Generator : un outil destiné à aider les scientifiques à générer des plans de gestion des données pour les projets financés par le FNS

Site web

DMP Canvas Generator est un outil destiné à aider les scientifiques à générer des plans de gestion des données pour les projets financés par le FNS. Un formulaire web composé de sept sections guide l'utilisateur dans la définition des exigences relatives à la gestion des données de son projet. Le document Word généré est conforme aux instructions du FNS pour la création d'un DMP et se compose de paragraphes génériques correspondant aux informations saisies par l'utilisateur. La structure du document généré suit celle du questionnaire DMP du FNS. Le document doit être modifié avant d'être soumis afin de refléter les spécificités du projet.

L'accès à cette ressource est possible avec un compte Switch AAI.

MetaNetX : Construction automatisée de modèles et annotation génomique pour les réseaux métaboliques à grande échelle

Site web

MetaNetX est un référentiel de réseaux métaboliques à l'échelle du génome (GSMN) et de voies biochimiques provenant d'un certain nombre de ressources majeures importées dans un espace de noms commun de composés chimiques, de réactions, de compartiments cellulaires (à savoir MNXref) et de protéines. Le site web MetaNetX.org donne accès à ces données intégrées ainsi qu'à divers outils permettant aux utilisateurs d'importer leurs propres GSMN, de les mapper à la réconciliation MNXref, et de manipuler, comparer, analyser, simuler (à l'aide d'une analyse de l'équilibre des flux) et exporter les GSMN obtenus. MNXref et MetaNetX sont régulièrement mis à jour et disponibles gratuitement.

Publication : Sébastien Moretti, Olivier Martin, T Van Du Tran, Alan Bridge, Anne Morgat, Marco Pagni MetaNetX/MNXref - reconciliation of metabolites and biochemical reactions to bring together genome-scale metabolic networks. Nucleic acids research, 44 (2016) doi:10.1093/nar/gkv1117

MyHits : une ressource interactive pour l'analyse des séquences protéiques

Site web

Hits est une base de données gratuite consacrée aux domaines protéiques. Il s'agit également d'un ensemble d'outils permettant d'étudier les relations entre les séquences protéiques et les motifs qui les caractérisent. Ces motifs sont définis par un ensemble hétérogène de prédicteurs, qui comprend actuellement des expressions régulières, des profils généralisés et des modèles de Markov cachés.

Publication : Pagni M, Ioannidis V, Cerutti L, Zahn-Zabal M, Jongeneel CV, Hau J, Martin O, Kuznetsov D, Falquet L. MyHits : améliorations apportées à une ressource interactive pour l'analyse des séquences protéiques. Nucleic Acids Res. Juillet 2007 ; 35(numéro sur les serveurs Web) : W433-7 lien vers la publication

OpenFlu : une base de données sur les virus de la grippe humaine et animale

La base de données OpenFlu (OpenFluDB) s'inscrit dans le cadre d'un effort collaboratif visant à partager les observations sur l'évolution du virus de la grippe chez les animaux et les humains. Elle contient des séquences génomiques et protéiques ainsi que des données épidémiologiques provenant de plus de 25 000 isolats.

Les annotations des isolats comprennent :

  1. le type, le sous-type et la lignée du virus
  2. l'hôte
  3. la localisation géographique
  4. la résistance aux antiviraux testée expérimentalement

Les séquences protéiques sont automatiquement dérivées des séquences nucléotidiques. À partir de celles-ci, la pathogénicité présumée et la propension à l'adaptation humaine sont calculées.

Chaque isolat viral peut être associé aux laboratoires qui l'ont collecté, séquencé et soumis.

Plusieurs outils d'analyse sont disponibles et permettent une exploration rapide et efficace.

  1. alignement multiple de séquences (MUSCLE)
  2. analyse phylogénétique
  3. cartes de similarité des séquences

Le contenu d'OpenFluDB est fourni par les utilisateurs eux-mêmes, ainsi que par une procédure automatique quotidienne qui importe les données provenant de référentiels publics (GenBank). De plus, un mécanisme simple facilite l'exportation des enregistrements d'OpenFluDB vers GenBank.

Publication : Liechti R, Gleizes A, Kuznetsov D, Bougueleret L, Le Mercier Ph, Bairoch A, Xenarios I. OpenFluDB, une base de données sur les virus de la grippe humaine et animale. Base de données, 2010 : baq004 (2010) doi :10.1093/database/baq004

pfsearch3 : recherche dans une bibliothèque de séquences protéiques ou d'ADN des segments de séquence correspondant à un profil

pftools

Le nouveau programme pfsearchV3 remplace le programme pfsearch original distribué avec pftools. Il utilise des instructions CPU modernes pour exploiter les capacités des processeurs multicœurs et un nouveau filtre heuristique pour évaluer et sélectionner rapidement les correspondances possibles. Sur un ordinateur moderne à double cœur et 8 cœurs, ces améliorations augmentent la vitesse de pfsearch de 2 ordres de grandeur.

SwissLipids : une base de connaissances sur la biologie des lipides

Site web

Motivation : Les lipides constituent un groupe vaste et diversifié de molécules biologiques qui jouent un rôle dans la formation des membranes, le stockage de l'énergie et la signalisation. Les lipidomes cellulaires peuvent contenir des dizaines de milliers de structures, ce qui représente un degré de complexité stupéfiant dont l'importance n'est pas encore entièrement comprise. Les plateformes basées sur la spectrométrie de masse à haut débit permettent d'étudier cette complexité, mais l'interprétation des données lipidomiques et leur intégration avec les connaissances antérieures sur la biologie des lipides souffrent d'un manque d'outils appropriés pour gérer les données et en extraire des connaissances.

Résultats : Afin de faciliter la description et l'exploration des données lipidomiques et leur intégration avec les connaissances biologiques antérieures, nous avons développé une ressource de connaissances sur les lipides et leur biologie : SwissLipids. SwissLipids fournit des connaissances sélectionnées sur les structures et le métabolisme des lipides, qui sont utilisées pour générer une bibliothèque in silico de structures lipidiques réalisables. Celles-ci sont classées dans une hiérarchie qui relie les résultats analytiques de la spectrométrie de masse à toutes les structures lipidiques, réactions métaboliques et enzymes possibles. SwissLipids fournit un espace de noms de référence pour la publication de données lipidomiques, l'exploration de données et la génération d'hypothèses. Nous mettons continuellement à jour la hiérarchie SwissLipids avec de nouvelles catégories de lipides et de nouvelles connaissances sélectionnées par des experts.

Publication : Aimo L, Liechti R, Hyka-Nouspikel N, Niknejad A, Gleizes A, Götz L, Kuznetsov D, David FP, van der Goot FG, Riezman H, Bougueleret L, Xenarios I, Bridge A. La base de connaissances SwissLipids pour la biologie des lipides. Bioinformatique, 31:2860-6. (2015) doi:10.1093/bioinformatics/btv285

Héritage :

boolSim : algorithmes basés sur des diagrammes de décision binaires ordonnés réduits (ROBDD) pour la modélisation booléenne des réseaux de régulation génétique

boolSim/genYsis est un logiciel écrit par Abhishek Garg. Il implémente des algorithmes basés sur des diagrammes de décision binaires ordonnés réduits (ROBDD) pour évaluer les attracteurs et réaliser des expériences de perturbation sur des réseaux booléens, en utilisant une dynamique de réseau synchrone ou asynchrone (https://doi.org/10.1093/bioinformatics/btn336).

Cette version de boolSim a été modifiée par Julien Dorier afin de :

Version 1.2.0
 

Distribution binaire

Documentation

ouvrir le PDF

Version 1.1.0
 

Distribution binaire

Documentation

ouvrir le PDF

boîte à outils genYsis

Il s'agit de la boîte à outils genYsis originale stockée ici à des fins d'archivage. Veuillez utiliser la version mise à jour boolSim ci-dessus.

les binaires genYsis Toolbox (v3.0 beta) sont disponibles pour les plateformes suivantes :

Linux ( 64 bits gcc version 4.4.5, Debian 4.4.5-8)
Mac OS X ( 64 bits gcc version 4.2.1, Mac OS X 10.8.5)


Après avoir téléchargé et extrait la distribution Linux, exécutez les deux commandes suivantes dans le répertoire « genYsis » :

 chmod +x boolSim
 chmod +x genYsis

 

CentrioleScreen : un criblage génomique fonctionnel dans des cellules humaines révèle de nouveaux régulateurs de la biogenèse des centrioles

Site web

Nous avons réalisé un criblage siRNA à l'échelle du génome afin d'identifier les gènes nécessaires au bon nombre de centrioles dans les cellules humaines. Un nombre correct de centrioles garantit la formation fidèle des cils primaires dans les cellules au repos et favorise l'assemblage robuste du fuseau bipolaire dans les cellules mitotiques. Normalement, les cellules naissent avec deux centrioles qui se dupliquent au cours du cycle cellulaire, de sorte qu'il y a quatre centrioles au moment de la mitose, deux dans chaque centrosome. Les cellules présentant un nombre inférieur de centrioles (« phénotype de sous-duplication ») présentent des problèmes notables au niveau de l'orientation du fuseau, de la fidélité de la ségrégation chromosomique et de la formation des cils. À l'inverse, les cellules présentant un nombre supérieur de centrioles (« phénotype de suramplification ») peuvent former des fuseaux multipolaires et présenter une ségrégation chromosomique imprécise. Malgré les criblages génétiques et génomiques fonctionnels réalisés sur des systèmes invertébrés, les mécanismes régissant le nombre correct de centrioles restent mal compris dans les cellules humaines. Ces considérations et d'autres liées à ce sujet nous ont amenés à développer et à réaliser un criblage génomique fonctionnel à l'échelle du génome dans ce système afin d'identifier les composants qui régulent le nombre de centrioles.

Cette interface web est une ressource qui permet aux utilisateurs d'accéder à l'intégralité des données issues du criblage. Les utilisateurs peuvent naviguer parmi les images et les valeurs numériques correspondantes (par exemple pour les caractéristiques des centrosomes et du noyau) pour les 76 138 expériences indépendantes qui ont été menées, testant en moyenne 4 siRNA distincts par gène. Les utilisateurs peuvent rechercher des gènes d'intérêt et classer l'ensemble des données selon différents critères. En outre, les utilisateurs peuvent ajouter des commentaires sur les expériences, contribuant ainsi à faire de cette interface une ressource riche pour l'exploration de la biologie cellulaire par la communauté scientifique.

Publication : Balestra et al., Discovering Regulators of Centriole Biogenesis through siRNA-Based Functional Genomics in Human Cells, Developmental Cell (2013) [pubmed : 23769972]

dbc454 : regroupement indépendant de la taxonomie, c'est-à-dire non supervisé, de séquences d'amplicons métagénomiques

Télécharger

Le regroupement indépendant de la taxonomie, c'est-à-dire non supervisé, des séquences d'amplicons métagénomiques est essentiel pour la définition des unités taxonomiques opérationnelles. Pour cette application, la reproductibilité et la robustesse devraient être les qualités les plus recherchées, mais elles ont jusqu'à présent été largement négligées.

La méthode est décrite et évaluée dans : Regroupement hiérarchique basé sur la densité de séquences pyro-séquencées à grande échelle — le cas de l'ITS1 fongique (doi: 10.1093/bioinformatics/btt149)

FastEpistasis : un outil logiciel capable de calculer des tests d'épistasie pour un grand nombre de paires de SNP, est une extension parallèle efficace du module d'épistasie PLINK

FastEpistasis, un outil logiciel capable de calculer des tests d'épistasie pour un grand nombre de paires de SNP, est une extension parallèle efficace du module d'épistasie PLINK. Il teste les effets épistatiques dans la régression linéaire normale d'une réponse quantitative sur les effets marginaux de chaque SNP et un effet d'interaction de la paire de SNP, où les SNP sont codés comme des effets additifs, en prenant des valeurs définies par l'utilisateur ou les valeurs par défaut 0, 1 et 2. Le test d'épistasie se réduit à vérifier si le terme d'interaction est significativement différent de zéro.

FastEpistasis optimise les calculs en divisant les tâches d'analyse en trois applications distinctes : pré-calcul, calcul principal et post-calcul.

  • La phase de pré-calcul charge les fichiers de données au format binaire PLINK, reformate les données pour accélérer les calculs et réduit le nombre de conditions à tester dans la phase centrale.
  • La phase de calcul principale est conçue pour paralléliser de manière embarrassante les calculs, en itérant sur les paires de SNP et en effectuant efficacement les tests d'épistasie. Les calculs sont basés sur l'application de la décomposition QR pour dériver les estimations des moindres carrés du coefficient d'interaction et de son erreur type. Le logiciel de calcul principal est disponible en plusieurs versions afin de tirer parti de différentes architectures hautes performances : une version pour processeur à mémoire partagée (SMP) et une version pour interface de passage de messages en grappe (MPI).
  • Une phase post-calcul optionnelle est fournie pour agréger les résultats de chaque processeur ou noyau, inclure des informations détaillées sur les SNP, calculer les valeurs p de chaque test et les convertir en fichiers texte.

Les sources sont disponibles à l'adresse suivante : https://gitlab.sib.swiss/tschuepb/FastEpistasis

Knoto-ID : un outil pour étudier l'enchevêtrement des chaînes protéiques ouvertes à l'aide du concept des knotoïdes

Télécharger Knoto-ID

La structure principale de la plupart des protéines forme une courbe ouverte. Pour étudier leur enchevêtrement, une stratégie courante consiste à rechercher la présence de nœuds dans leur structure principale à l'aide d'invariants topologiques. Cependant, cette approche nécessite de fermer la courbe en une boucle, ce qui modifie sa géométrie. Knoto-ID permet d'évaluer l'enchevêtrement de courbes ouvertes sans avoir à les fermer, en utilisant le concept récent des knotoïdes, qui est une généralisation de la théorie classique des nœuds aux courbes ouvertes. Knoto-ID peut analyser la topologie globale de la chaîne complète ainsi que la topologie locale en étudiant de manière exhaustive toutes les sous-chaînes ou en déterminant uniquement le noyau noué. L'utilisation de Knoto-ID ne se limite pas aux protéines, il peut être utilisé pour analyser toute courbe ouverte dans l'espace 3D, comme les chromosomes, les polymères synthétiques, les marches aléatoires, etc.

Si vous utilisez ce logiciel pour une publication, veuillez citer :
J. Dorier, D. Goundaroulis, F. Benedetti et A. Stasiak, « Knoto-ID : un outil pour étudier l'enchevêtrement des chaînes protéiques ouvertes à l'aide du concept de knotoïdes », Bioinformatique 34, 3402-3404 (2018).

Si vous utilisez la classification des knotoïdes fournie dans les fichiers examples/knotoid_names_sphere.txt ou examples/knotoid_names_planar.txt, veuillez citer :
D. Goundaroulis, J. Dorier et A. Stasiak, « A systematic classification of knotoids on the plane and on the sphere », arXiv:1902.07277 [math.GT].

Caractéristiques

Knoto-ID est une collection d'outils en ligne de commande permettant d'étudier les diagrammes de nœuds et de knotoïdes sur la sphère et dans le plan. Ses principales caractéristiques sont les suivantes :

  • Accepte les structures protéiques au format Protein Data Bank (PDB), les courbes 3D au format xyz, les diagrammes de nœuds et de knotoïdes au format code Gauss étendu ou au format code PD.
  • Dessiner des diagrammes de nœuds (ou knotoïdes).
  • Évaluer l'invariante polynomiale suivante : polynôme de Jones classique pour les nœuds, polynôme de Jones pour les knotoïdes et boucle de Turaev pour les knotoïdes planaires.
  • Évaluer l'invariant polynomial pour plusieurs directions de projection et produire des cartes de projection sur le plan des coordonnées sphériques ou directement sur un globe 3D (au format webGL interactif) avec la courbe 3D utilisée comme entrée.
  • Trouver les noyaux noués de courbes 3D.
  • Produire une courbe 3D (au format webGL interactif) et mettre en évidence son noyau noué.
  • Générer des matrices d'empreintes (pour les courbes ouvertes) et des matrices de disques (pour les courbes fermées) afin de résumer l'enchevêtrement de toutes les sous-chaînes d'une courbe 3D.

Veuillez lire le guide d'utilisation fourni avec Knoto-ID pour plus d'informations.

optimusqual : reconstruction de réseaux de régulation booléens à partir de connaissances issues de la littérature

Télécharger (Linux 64 bits avec libc>=2.12)

Implémentation de la méthode décrite dans Dorier et al. 2016.

Assistance

Pour toute question concernant le logiciel, veuillez contacter @email

SQUAD : un logiciel pour la modélisation dynamique des réseaux de régulation à l'aide de l'approche qualitative standardisée

Télécharger pour Linux 32 bits ou Windows (fonctionne uniquement avec Java 1.6 !)

SQUAD est un logiciel de modélisation dynamique des réseaux de régulation utilisant l'approche qualitative standardisée publiée par Mendoza et Xenarios. Le logiciel est décrit dans Di Cara et al., 2007.

Cette méthode présente trois aspects novateurs par rapport aux autres approches. Premièrement, l'utilisateur doit uniquement fournir la connectivité d'un réseau de régulation; aucune valeur de taux, aucune force d'interaction ni aucune donnée cinétique n'est nécessaire en entrée. Deuxièmement, les états d'activation stables du modèle continu sont automatiquement trouvés, sans qu'il soit nécessaire d'exécuter le système à partir de plusieurs états initiaux. Enfin, les équations obtenues comportent divers paramètres ajustables, ce qui permet d'adapter le modèle continu aux données expérimentales existantes. L'algorithme sur lequel repose SQUAD a déjà démontré sa capacité à décrire correctement le comportement qualitatif d'un vaste réseau de régulation.