Découverte :
L'indice de Jaccard, pas qu'une histoire de mailles...

J'ai utilisé dernièrement l'indice de Jaccard pour comparer des ensembles de mots. Comme c'est une mesure assez classique et plutôt utile, j'ai décidé de vous en parler un peu. Donc voici une introduction à l'indice de Jaccard, à ne pas confondre avec le pull Jacquard, ce n'est pas du tout la même chose.

L'indice de Jaccard est une mesure simple de similarité entre deux ensembles d'objets proposée par Paul Jaccard en 1901 [1,2]...

Bioinformatique :
J'ai lu: Statistiques pour statophobes

Bonjour à tous. J'aimerais partager avec vous un ouvrage qui a changé ma vie professionnelle, à plusieurs niveaux. En lieu et place d'une introduction, je vous offre quelques morceaux choisis, avec lesquels mes talents de rédactrice ne peuvent pas espérer lutter.

Abstract:
"Une introduction au monde des tests statistiques à l'intention des étudiants qui n'y entravent que pouic et qui détestent les maths par-dessus le marché...

Découverte :
Jouez avec vos données : utilisez un ORM

Il y a quelques temps, je vous ai parlé de base de données, un super moyen pour structurer vos données.
Vous êtes maintenant j'en suis sûr, des professionnels du SELECT, des JOIN et autres ALTER. C'est bien, très bien même, mais maintenant je vais vous apprendre à vous en passer. Et oui, la ligne de commande c'est sympa pour des choses simples et/ou rapides, mais dès que vous voulez plus de complexité, il devient difficile de travailler sans un langage de plus haut niveau...

Découverte :
DNase-seq, FAIRE-seq, ChIP-seq, trois outils d'analyse de la régulation de l'expression des gènes

La régulation de la transcription est un processus indispensable aux cellules pour permettre leur différenciation, exprimer leur spécificité, assurer leur développement, leur prolifération ou encore pour leur permettre de s'adapter à un environnement. L'étude de la régulation de la transcription passe par l'identification d'éléments clés gouvernant ces processus biologiques.
Ces éléments de régulations se distinguent en deux groupes : les régions cis-régulatrices (région de l'ADN ayant la particularité de contrôler l'expression de gènes plus ou moins éloignés), et les éléments trans (protéines de liaison à l'ADN reconnaissant la plupart du temps les séquences cis)...

Découverte :
Clusters et pipelines avec LSF

Aujourd'hui petit mash-up de deux articles précédemment publiés dans nos colonnes. Comme je l'avais promis, je vais vous présenter ma méthode pour faire du pipelining avec le gestionnaire de ressources de notre cluster. Si vous n'avez pas compris la phrase précédente, je vous invite à aller (re-)lire l'article sur les pipelines et celui sur les clusters, tout devrait être plus clair. Je vais présenter une idée simple : comment identifier chacune de vos commandes sur un cluster et utiliser cette identification pour les lier dans un pipeline...

Découverte :
Un tour d'horizon des bases de données consacrées au métabolisme

La toute première activité enzymatique a été découverte par Anselme Payen, un chimiste industriel français qui a piqué, grâce à son génie, la domination du marché de borax aux néerlandais. C'était une α-amylase, isolée à partir d'un extrait de malt, et capable de découper l'amidon en glucose. Nommée initialement diastase (synonyme d'"enzyme" à l'heure actuelle), c'était la première d'une longue série d'enzymes découvertes depuis et partageant le même suffixe : "ase"...

Bioinformatique :
Les identifiants : a (name)space oddity

Sur Bioinfo-fr.net, nous avons plusieurs fois parlé des bases de données biologiques. Que ce soit du point de vue de la gestion, de l'exploitation ou même du stockage physique. J'aimerai revenir aujourd'hui sur un souci qui se présente souvent lors de l'exploitation de plusieurs bases de données : les identifiants.
Un objet biologique dans une base de données est représenté par un identifiant...

Découverte :
Que faire de nos données biologiques produites ?

Qu'on soit affilié à un laboratoire de génomique, d'imagerie ou encore de protéomique nous avons tous un point commun : nous devons avoir un moyen fiable et dont la pérennité ne laisse pas à désirer pour ce qui est de la gestion de nos données produites/recueillies.
Les vieux sages vous diront, à juste titre, qu'il n'existe pas de meilleur moyen pour garantir le stockage de nos connaissances que de les graver sur des blocs de pierres et de les stocker dans un bunker à 50 mètres de profondeur...

Bioinformatique :
Bioinformatique : de sa génèse à nos jours, vue par la génétique

Pour de nombreux bioinformaticiens, les origines de la bioinformatique coulent de source. Cela nous a été enseigné lors de nos cursus ou, pour certains, ça a été une conversion normale par rapport à la formation d'origine -comprendre un informaticien qui travaille dans le domaine biologique.
Pour d'autres personnes, bioinformaticiennes ou non, les origines de la bioinformatique peuvent paraître floues, voire ne pas exister...

Découverte :
Mendeley: Une solution multi-plateforme pour organiser sa bibliographie

Je profite de l'élan initié par max dans son excellent article, "comment organiser sa veille en bioinformatique", pour vous parler un peu d'un logiciel que j'ai découvert récemment, et qui m'a été d'une aide considérable dans mon travail bibliographique.
Organiser et alimenter une veille efficace implique une recherche bibliographique régulière, donc lire, évaluer, garder ou mettre de côté des articles scientifiques...