|
|
# Réunion PhyloAlps #3
|
|
|
|
|
|
*27/03/2017*
|
|
|
|
|
|
## Participants
|
|
|
* Eric Coissac
|
|
|
* Frédéric Boyer
|
|
|
* Roland Douzet
|
|
|
* Anthony Hombiat
|
|
|
|
|
|
## Modèle de données
|
|
|
|
|
|
* Nomenclature ≠ taxonomie : la nomenclature binomiale contient les deux derniers niveaux de la taxonomie.
|
|
|
* Nomenclature :
|
|
|
* *Basionyme* : premier nom qui a été donné
|
|
|
* *Synonyme nomenclatural*
|
|
|
* *Synonyme de remplacement*
|
|
|
* Concept de `Curator` ≠ `Contributor` :
|
|
|
* `Curator` : spécialiste missionné par une institution pour renseigner les informations à propos des specimens d'une collection (par exemple, un herbier) dont il est, par suite, responsable.
|
|
|
* `Contributor` : Personne autorisée à ajouter des échantillons (`Sample`) dans la base et dont il est donc responsable.
|
|
|
* Le taxid du NCBI sera utilisé comme référence référentiel taxonomique de référence (!) : il sera donc obligatoire au moment de l'ajout d'un échantillon en bd.
|
|
|
* Les id dans d'autres référentiels taxonomiques pourront être renseignés lors de l'ajout d'un échantillon en bd, auquel cas ils seront marqués comme `expertised`. Sinon, et que le système est parvenu a les inferrer automatiquement, ils seront marqués comme `inferred`.
|
|
|
* Part d'herbier ≠ échantillon
|
|
|
* Part d'herbier (`HerbPress`) : planche avec un individu de l'espèce qui est enregistrer dans un herbier qui fera référence. La part d'herbier est une forme de collection de musée particulière.
|
|
|
* Echantillon (`Sample`) : Tout ou partie d'un ou plusieurs individu(s), pouvant faire (ou non) l'objet d'une part d'herbier.
|
|
|
* Tout ce qui a trait au metabarcoding dans le modèle doit être supprimé : l'objectif du projet PhyloAlps n'est pas d'enregistrer le résultat du metabarcoding mais d'être une base de référence à la disposition des personnes qui le pratique.
|
|
|
* Ajouter la chaine `SampleSet` > `Sample` > `DNAExtract` > `DNALibrary` > `DNARawSequences` > `DNAAssembly`
|
|
|
* Un extrait d'ADN (`DNAExtract`) ne peut être lié qu'à un échantillon (`Sample`), et pas à une part d'herbier (`HerbPress`) ni à un taxon (`Taxon`).
|
|
|
|
|
|
## Prototype
|
|
|
|
|
|
* Plusieurs petites bases de données relationnelles :
|
|
|
* Taxonomie NCBI sur *ncbi*.phyloalps.org
|
|
|
* Taxonomie PlantList sur *sajf*.phyloalps.org
|
|
|
* Herbier SAJF sur *plantlist*.phyloalps.org
|
|
|
* etc.
|
|
|
* Modèle de données englobant en RDF
|
|
|
* Association modèle relationnel - modèle graphe via une des [implémentations de la R2RML]
|
|
|
* Le prototype devra servir de preuve de concept sur une bd de moins de 100 000 échantillons.
|
|
|
* Les mises à jour se feront sous la forme de nouvelles versions délivrées ponctuellement, pas d'intégration continue.
|
|
|
|
|
|
## TODO
|
|
|
* Rajouter carte d'échantillonnage PhyloAlps sur [phyloalps.org]
|
|
|
* Ajouter courriels de contact et courriels des membres du projet via [gandi.net]
|
|
|
* Faire le lien entre les référentiels taxonomiques de PlantList et du NCBI
|
|
|
* Sur une machine virtuelle NixOS, mettre en place un SGBD PostgreSQL hébergeant la taxonomie du NCBI et l'implémentation R2RML permettant de l'interroger en SPARQL
|
|
|
|
|
|
[phyloalps.org]:http://phyloalps.org
|
|
|
[gandi.net]:https://www.gandi.net/
|
|
|
[implémentations de la R2RML]:https://www.w3.org/2001/sw/rdb2rdf/wiki/Implementations |