Dans l’équation de veille, la gestion des opérateurs (OR et NOT) fournit l’occasion de revisiter quelques-uns des fondamentaux de l’interrogation de la banque de données.
En théorie : trois données essentielles
La première donnée 
Formuler une équation de veille dans PubMed consiste à interroger d’une part la partie indexée de la banque de données et d’autre part sa partie non indexée.
Pourquoi 2 parties ?
Ces 2 parties sont une particularité de PubMed.
Elle est liée au délai nécessaire à l’indexation des articles.
Ce délai est :
– court pour les « dinosaures » de la presse médicale internationale (NEJM, Jama, Annals of Internal Medicine…) ;
– plus long pour les autres périodiques, notamment ceux qui ne sont pas anglophones.
C’est ce qui conduit à l’existence :
– d’un PubMed indexé (dénommé MEDLINE),
– et d’un PubMed non indexé (en attente ou en cours d’indexation, ce qui représente entre 2 et 6% du contenu de la banque de données).
Pourquoi interroger les 2 parties ?
L’interrogation de la partie non indexée est capitale car cette partie contient la majeure partie des articles les plus récents. En effet, en tant que récents, leur principal risque est de ne pas être indexés.
L’interrogation de la partie indexée est tout aussi capitale car il n’est pas possible d’écarter les articles récents en provenance du cœur (Core Clinical Journals) des périodiques médicaux (et, a priori déjà indexés).
Pourquoi interroger les 2 parties différemment ?
La seule raison est la présence d’un index dans un cas et son absence dans l’autre.
La partie indexée est interrogée « dans les règles » par une équation de recherche conforme au langage (MeSH) et à la grammaire (affiliations, champs, opérateurs) de PubMed. C’est possible en s’appuyant sur le contenu de l’index.
En l’absence d’index, la partie non indexée est interrogée « en mode dégradé ». L’index est remplacé par les titres et résumés, mis à la disposition de PubMed par les éditeurs et dans lesquels sont recherchés les termes de la requête. Comme ceux-ci sont rarement des descripteurs, l’outil de recherche est interrogé avec les synonymes en langage courant de ces descripteurs.
La deuxième donnée
En faisant appel aux opérateurs booléens*, la requête partie indexée ET (AND) partie non indexée est formulée partie indexée OU (OR) partie non indexée.
Pourquoi traduire AND par OR ?
AND croise
En se référant à Google, l’équation asthme AND bronchite affiche toutes les pages du Web contenant à la fois les mots asthme et bronchite.
OR unit
Toujours dans Google, l’équation asthme OR bronchite affiche toutes les pages du Web contenant le mot asthme, toutes celles contenant le mot bronchite (et toutes celles contenant les 2 mots).
A l’évidence, c’est l’opérateur OR qui convient le mieux à ce que vous attendez de votre équation de veille : l’affichage des références de la partie indexée et celui des références de la partie non indexée.
La troisième donnée
Dans l’équation de veille, la partie non indexée est interrogée indépendamment de la partie indexée. L’équation exclut cette partie indexée de l’interrogation de la partie non indexée.
Schématiquement, l’équation de veille est formulée : partie indexée OR (partie non indexée NOT partie indexée)**.
Quelle est la justification de cette exclusion ?
La principale est la cohérence dans la formulation de l’équation. En l’absence d’exclusion, l’interrogation « en mode dégradé » (synonymes et champ [tiab]) est faite aussi bien dans la partie non indexée que dans la partie indexée. Comme cette dernière a déjà été interrogée « dans les règles », rien ne justifie qu’elle le soit aussi « en mode dégradé ». D’où l’exclusion.
Quelles sont les conséquences pratiques de cette exclusion ?
Cette exclusion nécessite la mise en place de parenthèses aux bons endroits (voir plus loin : « en(tre) parenthèses »).
En live : une équation de veille
Vous envisagez une veille bibliographique sur le thème « les SMS dans le sevrage tabagique ».
Vous formulez votre équation de veille selon le modèle : partie indexée OR (partie non indexée NOT partie indexée)
La partie indexée est formulée « dans les règles » selon le langage et la grammaire de la banque de données.
Smoking Cessation/MT AND Text Messaging [mh]
La partie non indexée est formulée « en mode dégradé ».
Vous croisez (opérateur AND) :
– d’une part smoking cessation et ses synonymes (eux-mêmes croisés avec methods et ses synonymes),
– d’autre part text messaging et ses synonymes.
Smoking cessation et ses synonymes sont unis par l’opérateur OR. Il en est de même de methods et ses synonymes et de text messaging et ses synonymes.
Tous ces termes sont recherchés dans les titres et les résumés (champ [tiab]).
Les deux parties sont unies par OR et la partie indexée est exclue de l’interrogation de la partie non indexée (opérateur NOT).
Au total, l’équation de veille sur « SMS dans le sevrage tabagique » se formule ainsi :
Smoking Cessation/MT AND Text Messaging [mh] OR ((smoking cessation [tiab] OR smoking cessations [tiab]) AND (text messaging [tiab] OR texting*[tiab] OR text message* [tiab] OR short message service [tiab]) AND (methods [tiab] OR techniques [tiab] OR procedures [tiab] OR methodology [tiab]) NOT MEDLINE [sb])
En clair : le live commenté
Il y a peu à dire sur la formulation de la partie indexée.
Le qualificatif methods est affilié à bon escient au descripteur Smoking Cessation. L’affiliation correspond au thème de la requête. Elle n’a nul besoin de champ, étant reconnue comme telle par PubMed.
Le champ MeSH terms ([mh]) est attribué à Text Messaging pour éviter que le descripteur soit « mouliné » par l’Automatic term mapping.
L’équation est « dans les règles ».
Il y a un peu plus à dire sur la formulation « en mode dégradé » de la partie non indexée.
Comme il a été dit précédemment, dans ce type de formulation, les titres et les résumés font office d’index et les termes MeSH sont unis (opérateur OR) à leurs synonymes en langage courant.
La liste des synonymes (en langage courant) de chaque descripteur (terme MeSH) figure dans la banque de données du MeSH (MeSH Database). Vous pouvez vous abstenir de retenir comme synonymes
– les pluriels car la troncature droite (voir note) permet de les prendre en compte ;
– les « synonymes à virgule » car les chances qu’ils figurent dans un titre ou un résumé sont faibles pour ne pas dire inexistantes.
L’exclusion de la partie indexée se traduit en langage de requête par NOT MEDLINE [sb], MEDLINE étant pris en compte pour son statut vis-à-vis de l’indexation (citation status) d’où son champ « subset »([sb]).
Note
Dans PubMed, la troncature droite est signalée par un astérisque (*). Elle signifie, entre autres, que sont pris en compte le singulier et le pluriel.
testing* = testing OR testings
En(tre) parenthèses
Les difficultés rencontrées dans la mise en place des parenthèses sont bien réelles. Elles concernent les opérateurs OR et NOT.
Pour OR, la règle est simple : les termes encadrant l’opérateur OR sont mis entre parenthèses.
Une exception : quand OR est le premier opérateur de l’équation, les parenthèses sont inutiles.
Exemple
smoking cessation [ti] AND (methods [tiab] OR procedures [tiab])
methods [tiab] OR procedures [tiab] AND smoking cessation [ti]
Pour NOT, la règle dépend du contexte.
Si vous formulez une équation sur la contraception de l’adolescente, c’est simple : vous excluez les adultes de l’équation. Les parenthèses sont inutiles.
Contraception/MT AND Adolescent [mh] NOT Adult [mh]
En revanche, cela devient plus compliqué si vous prenez l’exemple de l’équation de veille sur « les SMS dans le sevrage tabagique ». Une seule raison à cela : vous devez écarter la première équation de la deuxième.
partie indexée OR partie non indexée NOT partie indexée
Si vous ne faites rien (pas de parenthèses), les deux « parties indexées » s’annulent et vous affichez dans la page de résultat les références de la partie non indexée.
Les parenthèses permettent de remédier à cela en isolant la partie de l’équation concernée par NOT : une parenthèse avant, une parenthèse après.
Exemple avec la veille sur les SMS dans le sevrage tabagique.
Smoking Cessation/MT AND Text Messaging [mh] OR ((smoking cessation [tiab] OR smoking cessations [tiab]) AND (text messaging [tiab] OR texting*[tiab] OR text message* [tiab] OR short message service [tiab]) AND (methods [tiab] OR techniques [tiab] OR procedures [tiab] OR methodology [tiab]) NOT MEDLINE [sb])
La première parenthèse « ouvre » la partie concernée par l’exclusion (qui va de smoking cessation [tiab] à methodology [tiab]). La dernière parenthèse « ferme » la partie exclue (MEDLINE [sb]).
Note
Pas de panique !
Quand le résultat obtenu avec votre équation de veille ne vous semble pas très cohérent (notamment dans le rapport non indexés/indexés), décomposez votre équation en plusieurs parties et testez l’interrogation de chacune d’elles dans PubMed. Vous trouverez facilement le défaut.
Ce billet de blog est long
Si vous avez été jusqu’au bout : bravo ! Vous avez du mérite et vous savez, maintenant, formuler une équation de veille. Si vous avez abandonné en cours de route, ne vous formalisez pas. Formulez vos équations de veille « comme vous le sentez », mais sans solliciter le module de veille de MyNCBI (create alert) qui n’est qu’un gadget pour geek borné.
Ce billet de blog est long, trop long, mais c’est un concentré (un peu lourd à digérer) de ce que vous devez savoir et que vous ne trouverez nulle part ailleurs. Faites-en ce que vous voulez : stockez-le, imprimez-le, distribuez-le… Vous pouvez en disposer librement : il est publié sous licence Creative Commons Attribution (CC BY 2.0) comme tous les billets de ce blog. Votre seule contrainte est de mentionner le nom de son auteur quand vous le diffusez.
C’est un avant-goût de la nouvelle version de l’Anti-manuel de PubMed à paraitre chez Amazon au début du mois de mai 2017.
*Les opérateurs booléens (du nom de George Boole, un mathématicien anglais du XIXè Siècle) sont :
– AND (ET) qui croise les termes de la requête ;
– OR (OU) qui les unit ;
– NOT (SANS) qui exclut l’un des termes.
**Le principe de l’équation de veille dans PubMed est exposé dans l’article :
Damarell RA, Tieman JJ, Sladek RM.
OvidSP Medline-to-PubMed search filter translation: a methodology for extending search filter range to include PubMed’s unique content.
BMC Med Res Methodol. 2013 Jul 2;13:86. doi:10.1186/1471-2288-13-86.
PubMed PMID: 23819658; PubMed Central PMCID: PMC3700762.