Attuale:
DMP Canvas Generator: uno strumento che aiuta gli scienziati a generare piani di gestione dei dati per i progetti finanziati dal FNS
DMP Canvas Generator è uno strumento che aiuta gli scienziati a generare piani di gestione dei dati per i progetti finanziati dal FNS. Un modulo web composto da sette sezioni guida l'utente nella definizione dei requisiti per la gestione dei dati del proprio progetto. Il documento Word prodotto è conforme alle istruzioni del FNS per la creazione di DMP e consiste in paragrafi generici corrispondenti agli input dell'utente. La struttura del documento prodotto segue la struttura del questionario DMP del FNS. Il documento deve essere ulteriormente modificato prima della presentazione per riflettere gli aspetti specifici del progetto.
L'accesso a questa risorsa è possibile con un account Switch AAI.
MetaNetX: Costruzione automatizzata di modelli e annotazione del genoma per reti metaboliche su larga scala
MetaNetX è un archivio di reti metaboliche su scala genomica (GSMN) e percorsi biochimici provenienti da una serie di risorse principali importate in uno spazio dei nomi comune di composti chimici, reazioni, compartimenti cellulari, ovvero MNXref, e proteine. Il sito web MetaNetX.org fornisce l'accesso a questi dati integrati e a una serie di strumenti che consentono agli utenti di importare le proprie GSMN, mapparle alla riconciliazione MNXref e manipolare, confrontare, analizzare, simulare (utilizzando l'analisi del bilancio di flusso) ed esportare le GSMN risultanti. MNXref e MetaNetX sono aggiornati regolarmente e disponibili gratuitamente.
Pubblicazione: Sébastien Moretti, Olivier Martin, T Van Du Tran, Alan Bridge, Anne Morgat, Marco Pagni MetaNetX/MNXref - riconciliazione di metaboliti e reazioni biochimiche per riunire reti metaboliche su scala genomica. Ricerca sugli acidi nucleici, 44 (2016) doi:10.1093/nar/gkv1117
MyHits: una risorsa interattiva per l'analisi delle sequenze proteiche
Hits è un database gratuito dedicato ai domini proteici. È anche una raccolta di strumenti per lo studio delle relazioni tra sequenze proteiche e motivi descritti su di esse. Questi motivi sono definiti da una raccolta eterogenea di predittori, che attualmente include espressioni regolari, profili generalizzati e modelli Markov nascosti.
Pubblicazione: Pagni M, Ioannidis V, Cerutti L, Zahn-Zabal M, Jongeneel CV, Hau J, Martin O, Kuznetsov D, Falquet L. MyHits: miglioramenti a una risorsa interattiva per l'analisi delle sequenze proteiche. Nucleic Acids Res. Luglio 2007; 35(numero Web Server):W433-7 link alla pubblicazione
OpenFlu: un database sui virus dell'influenza umana e animale
Il database OpenFlu (OpenFluDB) fa parte di un progetto collaborativo volto a condividere le osservazioni sull'evoluzione del virus dell'influenza sia negli animali che nell'uomo. Contiene sequenze genomiche e proteiche, nonché dati epidemiologici relativi a oltre 25 000 isolati.
Le annotazioni degli isolati includono:
- tipo di virus, sottotipo e lignaggio
- ospite
- posizione geografica
- resistenza antivirale testata sperimentalmente
Le sequenze proteiche sono derivate automaticamente dalle sequenze nucleotidiche. Da queste vengono calcolate la presunta maggiore patogenicità e la propensione all'adattamento umano.
Ogni isolato virale può essere associato ai laboratori che lo hanno raccolto, sequenziato e inviato.
Sono disponibili diversi strumenti di analisi che consentono un'estrazione rapida ed efficiente.
- allineamento multiplo di sequenze (MUSCLE)
- analisi filogenetica
- mappe di similarità delle sequenze
I contenuti di OpenFluDB sono forniti dall'invio diretto degli utenti e da una procedura automatica giornaliera che importa i dati da archivi pubblici (GenBank). Inoltre, un semplice meccanismo facilita l'esportazione dei record di OpenFluDB su GenBank.
Pubblicazione: Liechti R, Gleizes A, Kuznetsov D, Bougueleret L, Le Mercier Ph, Bairoch A, Xenarios I. OpenFluDB, un database per il virus dell'influenza umana e animale. Database, 2010:baq004 (2010) doi:10.1093/database/baq004
pfsearch3: ricerca in una libreria di sequenze proteiche o di DNA i segmenti di sequenza che corrispondono a un profilo
Il nuovo programma pfsearchV3 sostituisce il programma pfsearch originale distribuito con pftools. Utilizza moderne istruzioni CPU per sfruttare le capacità dei processori multicore e un nuovo filtro euristico per valutare e selezionare rapidamente i possibili candidati corrispondenti. Su un moderno computer dual-threaded a 8 core, questi miglioramenti aumentano la velocità di pfsearch di 2 ordini di grandezza.
SwissLipids: una banca dati dedicata alla biologia dei lipidi
Motivazione: i lipidi sono un gruppo ampio e diversificato di molecole biologiche che svolgono un ruolo nella formazione delle membrane, nell'immagazzinamento dell'energia e nella segnalazione. I lipidomi cellulari possono contenere decine di migliaia di strutture, un grado di complessità sbalorditivo la cui importanza non è ancora stata completamente compresa. Le piattaforme basate sulla spettrometria di massa ad alta produttività forniscono uno strumento per studiare questa complessità, ma l'interpretazione dei dati lipidomici e la loro integrazione con le conoscenze pregresse sulla biologia dei lipidi risentono della mancanza di strumenti adeguati per gestire i dati ed estrarne conoscenze.
Risultati: Per facilitare la descrizione e l'esplorazione dei dati lipidomici e la loro integrazione con le conoscenze biologiche pregresse, abbiamo sviluppato una risorsa di conoscenze sui lipidi e la loro biologia: SwissLipids. SwissLipids fornisce conoscenze curate sulle strutture e sul metabolismo dei lipidi, che vengono utilizzate per generare una libreria in silico di strutture lipidiche fattibili. Queste sono organizzate in una classificazione gerarchica che collega i risultati analitici della spettrometria di massa a tutte le possibili strutture lipidiche, reazioni metaboliche ed enzimi. SwissLipids fornisce uno spazio dei nomi di riferimento per la pubblicazione di dati lipidomici, l'esplorazione dei dati e la generazione di ipotesi. Aggiorniamo continuamente la gerarchia di SwissLipids con nuove categorie di lipidi e nuove conoscenze curate da esperti.
Pubblicazione: Aimo L, Liechti R, Hyka-Nouspikel N, Niknejad A, Gleizes A, Götz L, Kuznetsov D, David FP, van der Goot FG, Riezman H, Bougueleret L, Xenarios I, Bridge A. La base di conoscenze SwissLipids per la biologia dei lipidi. Bioinformatica, 31:2860-6. (2015) doi:10.1093/bioinformatics/btv285
Eredità:
boolSim: algoritmi basati su diagrammi di decisione binari ordinati ridotti (ROBDD) per la modellizzazione booleana delle reti di regolazione genica
boolSim/genYsis è un software scritto da Abhishek Garg. Implementa algoritmi basati su diagrammi di decisione binari ordinati ridotti (ROBDD) per valutare gli attrattori ed eseguire esperimenti di perturbazione su reti booleane, utilizzando dinamiche di rete sincrone o asincrone (https://doi.org/10.1093/bioinformatica/btn336).
Questa versione di boolSim è stata modificata da Julien Dorier per:
- interpretare reti con regole logiche complesse.
- accettare reti in formato sbml-qual (https://dx.doi.org/10.1186/1752-0509-7-135 e https://dx.doi.org/10.2390/biecoll-jib-2015-270
- produrre insiemi di stati raggiungibili da un insieme di stati iniziali definiti dall'utente.
Versione 1.2.0
Distribuzione binaria
Documentazione
Versione 1.1.0
Distribuzione binaria
Documentazione
genYsis Toolbox
Questo è il toolbox genYsis originale archiviato qui a scopo di archiviazione. Si prega di utilizzare la versione aggiornata boolSim sopra indicata.
i binari di genYsis Toolbox (v3.0 beta) sono disponibili per le seguenti piattaforme:
Linux ( 64 bit gcc versione 4.4.5, Debian 4.4.5-8)
Mac OS X ( 64 bit gcc versione 4.2.1, Mac OS X 10.8.5)
Dopo aver scaricato ed estratto la distribuzione Linux, eseguire i seguenti due comandi nella directory "genYsis":
chmod +x boolSim chmod +x genYsis
CentrioleScreen: uno screening genomico funzionale su cellule umane rivela nuovi regolatori della biogenesi dei centrioli
Abbiamo eseguito uno screening siRNA su tutto il genoma per identificare i geni necessari per il corretto numero di centrioli nelle cellule umane. Il corretto numero di centrioli garantisce la formazione fedele delle ciglia primarie nelle cellule a riposo e favorisce il robusto assemblaggio del fuso bipolare nelle cellule mitotiche. Normalmente, le cellule nascono con due centrioli che si duplicano durante il ciclo cellulare, in modo che al momento della mitosi ci siano quattro centrioli, due in ciascun centrosoma. Le cellule con un numero inferiore di centrioli ("fenotipo di sottoduplicazione") presentano problemi notevoli nell'orientamento del fuso, nella fedeltà della segregazione cromosomica e nella formazione delle ciglia. Al contrario, le cellule con un numero superiore di centrioli ("fenotipo di sovramplificazione") possono formare fusi multipolari e presentare una segregazione cromosomica non fedele. Nonostante gli screening genetici e genomici funzionali condotti su sistemi invertebrati, i meccanismi che regolano il corretto numero di centrioli rimangono ancora incompleti nelle cellule umane. Queste e altre considerazioni correlate ci hanno portato a sviluppare ed eseguire uno screening genomico funzionale su scala genomica in questo sistema per identificare i componenti che regolano il numero di centrioli.
Questa interfaccia web è una risorsa che consente agli utenti di avere pieno accesso ai dati dello screening. Gli utenti possono navigare tra le immagini e i valori numerici corrispondenti (ad esempio per le caratteristiche dei centrosomi e dei nuclei) per i 76138 esperimenti indipendenti che sono stati condotti, testando in media 4 siRNA distinti per gene. Gli utenti possono cercare i geni di interesse e classificare l'intero database in base a vari criteri. Inoltre, gli utenti possono aggiungere commenti sugli esperimenti, contribuendo così a rendere questa interfaccia una ricca risorsa per l'esplorazione della biologia cellulare da parte della comunità scientifica.
Pubblicazione: Balestra et al., Discovering Regulators of Centriole Biogenesis through siRNA-Based Functional Genomics in Human Cells, Developmental Cell (2013) [pubmed: 23769972]
dbc454: raggruppamento indipendente dalla tassonomia, ovvero non supervisionato, di sequenze di ampliconi metagenomici
Il raggruppamento indipendente dalla tassonomia, ovvero non supervisionato, delle sequenze di ampliconi metagenomici è essenziale per la definizione delle unità tassonomiche operative. Per questa applicazione, la riproducibilità e la robustezza dovrebbero essere le qualità più ricercate, ma finora sono state in gran parte trascurate.
Il metodo è descritto e valutato in: Raggruppamento gerarchico basato sulla densità di sequenze piro su larga scala: il caso dell'ITS1 fungino (doi: 10.1093/bioinformatica/btt149)
FastEpistasis: uno strumento software in grado di calcolare test di epistasi per un gran numero di coppie di SNP, è un'efficiente estensione parallela al modulo di epistasi PLINK
FastEpistasis, uno strumento software in grado di calcolare i test di epistasi per un gran numero di coppie di SNP, è un'efficiente estensione parallela al modulo di epistasi PLINK. Verifica gli effetti epistatici nella normale regressione lineare di una risposta quantitativa sugli effetti marginali di ciascun SNP e sull'effetto di interazione della coppia di SNP, dove gli SNP sono codificati come effetti additivi, assumendo valori definiti dall'utente o i valori predefiniti 0, 1 e 2. Il test di epistasi si riduce alla verifica se il termine di interazione è significativamente diverso da zero.
FastEpistasis ottimizza i calcoli suddividendo le attività di analisi in tre applicazioni separate: pre-calcolo, calcolo principale e post-calcolo.
- La fase di pre-calcolo carica i file di dati in formato binario PLINK, riformatta i dati per calcoli più veloci e riduce il numero di condizioni da testare nella fase centrale.
- La fase di calcolo principale è progettata per parallelizzare in modo imbarazzante i calcoli, iterando attraverso coppie di SNP ed eseguendo in modo efficiente i test per l'epistasi. I calcoli si basano sull'applicazione della decomposizione QR per ricavare stime dei minimi quadrati del coefficiente di interazione e del suo errore standard. Il software di calcolo principale è disponibile in diverse versioni per sfruttare le diverse architetture ad alte prestazioni: una versione con processore a memoria condivisa (SMP) e una versione con interfaccia di passaggio dei messaggi (MPI) in cluster.
- È prevista una fase post-calcolo opzionale per aggregare i risultati di ciascun processore o core, includere informazioni dettagliate sugli SNP, calcolare i valori p di ciascun test e convertirli in file di testo.
Le fonti sono disponibili all'indirizzo: https://gitlab.sib.swiss/tschuepb/FastEpistasis
Knoto-ID: uno strumento per studiare l'intreccio delle catene proteiche aperte utilizzando il concetto di knotoidi
La struttura portante della maggior parte delle proteine forma una curva aperta. Per studiarne l'intreccio, una strategia comune consiste nel ricercare la presenza di nodi nella loro struttura portante utilizzando invarianti topologici. Tuttavia, questo approccio richiede di chiudere la curva in un anello, alterandone la geometria. Knoto-ID consente di valutare l'intreccio delle curve aperte senza la necessità di chiuderle, utilizzando il recente concetto di knotoidi, che è una generalizzazione della teoria classica dei nodi alle curve aperte. Knoto-ID è in grado di analizzare la topologia globale dell'intera catena, nonché la topologia locale, studiando in modo esaustivo tutte le sottocatene o determinando solo il nucleo annodato. L'uso di Knoto-ID non è limitato alle proteine, ma può essere utilizzato per analizzare qualsiasi curva aperta nello spazio 3D, come cromosomi, polimeri sintetici, passeggiate casuali, ecc.
Se si utilizza questo software per una pubblicazione, si prega di citare:
J. Dorier, D. Goundaroulis, F. Benedetti e A. Stasiak, "Knoto-ID: uno strumento per studiare l'intreccio delle catene proteiche aperte utilizzando il concetto di knotoidi", Bioinformatica 34, 3402-3404 (2018).
Se si utilizza la classificazione dei knotoidi fornita nei file examples/knotoid_names_sphere.txt
o examples/knotoid_names_planar.txt
, si prega di citare:
D. Goundaroulis, J. Dorier e A. Stasiak, "A systematic classification of knotoids on the plane and on the sphere", arXiv:1902.07277 [math.GT].
Caratteristiche
Knoto-ID è una raccolta di strumenti a riga di comando per lo studio dei diagrammi di nodi e knotoidi sulla sfera e sul piano. Le sue caratteristiche principali sono:
- Accetta strutture proteiche in formato Protein Data Bank (PDB), curve 3D in formato xyz, diagrammi di nodi e knotoidi in formato codice Gauss esteso o formato codice PD.
- Disegna diagrammi di nodi (oidi).
- Valuta il seguente invariante polinomiale: polinomio di Jones classico per i nodi, polinomio di Jones per i knotoidi e parentesi di Turaev per i knotoidi planari.
- Valutare l'invariante polinomiale per più direzioni di proiezione e produrre mappe di proiezione sul piano delle coordinate sferiche o direttamente su un globo 3D (in formato webGL interattivo) con la curva 3D utilizzata come input.
- Trovare i nuclei annodati delle curve 3D.
- Generare una curva 3D (in formato webGL interattivo) ed evidenziare il suo nucleo annodato.
- Generare matrici di impronte digitali (per curve aperte) e matrici di dischi (per curve chiuse) per riassumere l'intreccio di tutte le sottocatene di una curva 3D.
Per ulteriori informazioni, leggere la guida utente distribuita con Knoto-ID.
optimusqual: ricostruzione della rete regolatoria booleana utilizzando conoscenze basate sulla letteratura
Download (Linux 64 bit con libc>=2.12)
Implementazione del metodo descritto in Dorier et al. 2016.
Assistenza
Per domande relative al software, contattare @email
SQUAD: un software per la modellizzazione dinamica delle reti regolatorie utilizzando l'approccio qualitativo standardizzato
Scarica per Linux o Windows a 32 bit (funziona solo con Java 1.6!)
SQUAD è un software per la modellizzazione dinamica delle reti regolatorie che utilizza l'approccio qualitativo standardizzato pubblicato da Mendoza e Xenarios. Il software è descritto in Di Cara et al., 2007.
Il metodo presenta tre aspetti innovativi rispetto ad altri approcci. In primo luogo, l'utente deve fornire solo la connettività di una rete regolatoria; non sono necessari valori di velocità, intensità di interazione o dati cinetici come input. In secondo luogo, gli stati stazionari stabili di attivazione del modello continuo vengono individuati automaticamente, senza la necessità di eseguire il sistema da diversi stati iniziali. In terzo luogo, le equazioni risultanti hanno diversi parametri regolabili in modo da offrire la possibilità di adattare il modello continuo ai dati sperimentali esistenti. L'algoritmo alla base di SQUAD ha già dimostrato di descrivere correttamente il comportamento qualitativo di una grande rete regolatoria.