Non-infériorité et équivalence

Publié le : 25 avril 2022

HematoStat.net (M)

Contexte

Un nouveau traitement peut présenter des avantages sur une thérapeutique de référence autres qu’une meilleure efficacité, et liés à une meilleure tolérance (effets secondaires moins fréquents et/ou moins graves, amélioration de la qualité de vie), une posologie moins contraignante et moins lourde (voie d’administration plus simple), ou un coût moins élevé. Cependant, il faut s’assurer que la perte d’efficacité consentie pour ce nouveau traitement comparé à celui de référence n’excède pas une limite définie en amont. On parle alors d’un essai dit de « non-infériorité », différent du schéma classique de « supériorité », à la fois dans sa construction, son exploitation et son interprétation avec laquelle il faut être prudent.

Essai de non-infériorité : principe et méthodologie

Tester la non-infériorité, ce n’est pas tenter de conclure à une efficacité identique, mais simplement montrer que le traitement expérimental a une efficacité suffisante. Il faut pour cela que les investigateurs justifient et définissent donc a priori cette limite, une borne de non-infériorité en deçà de laquelle le ratio ou la différence entre les mesures d’efficacité des deux traitements sera considéré(e) comme inacceptable car trop important(e). Le choix du seuil en fonction de la pathologie, du critère de jugement et des avantages apportés par le traitement expérimental, détermine la taille de l’étude et l’interprétation des résultats. Plus la perte d’efficacité consentie est faible, plus le nombre de sujets nécessaires de l’essai sera important.

La détermination de cette borne de non-infériorité se fait donc relativement aux résultats du traitement standard, puisque l’on travaille sur un écart toléré entre les thérapeutiques. Par exemple, ce choix peut être guidé justement par le bénéfice qu’apporte le traitement standard par rapport au placebo s’il a prouvé son efficacité face à un produit de ce type, ou par rapport à un autre traitement si la littérature renseigne un essai de supériorité sur un autre produit. Ainsi, le seuil sélectionné pourra assurer que le nouveau traitement ne peut être moins bon qu’une thérapeutique à laquelle le traitement standard est déjà supérieur. D’un point de vue statistique, le test de non-infériorité se pose comme suit si l’on choisit d’exprimer l’écart d’efficacité en termes de différence sur un paramètre (la démarche est évidemment similaire pour un ratio, à la différence que les comparaisons se font alors avec la valeur 1 au lieu de 0). On note μ_refet μ_exples vraies efficacités (taux de réponse, probabilité de survie à un temps donné), respectivement du traitement de référence et de l’expérimental. Soient Δ = μ_exp-μ_refla différence des efficacités et Δ_eqla valeur absolue de la borne de non-infériorité à laquelle sera comparée le paramètre Δ. Le test d’hypothèses s’écrit ainsi :

H₀: Δ ≤ -Δ_eq, i.e. le traitement expérimental est inférieur au standard ;
H1: Δ > -Δ_eq, i.e. le traitement expérimental est non inférieur au standard

L’analyse repose alors sur une démarche basée sur l’intervalle de confiance du paramètre Δ et doit veiller à en examiner le sens (positif et négatif). Il y a ainsi plusieurs scenarii possibles, comme l’illustre la figure 1.

On a alors plusieurs cas de figures :

si la borne supérieure de l’intervalle est inférieure ou égale à -Δ_eq, alors le traitement expérimental est inférieur au standard ;
on ne peut conclure à une non-infériorité si l’intervalle de confiance contient la valeur -Δ_eq;
on conclut à une non-infériorité si la borne inférieure de l’intervalle est strictement supérieure à -Δ_eq.

Biais potentiels et solutions

Les essais de non-infériorité et d’équivalence diffèrent de ceux de supériorité également dans les biais potentiels, et par extension sur la méthodologie pour les éviter et la population à analyser. Il faut d’une part veiller à ce que l’efficacité du traitement de référence ne soit pas altérée (à cause d’un défaut d’administration, d’une population qui y répond mal ou d’une tolérance qui entraîne des arrêts fréquents) parce qu’elle a une grande influence sur le choix du seuil et que cela peut conduire à des conclusions erronées sur la non-infériorité du traitement expérimental.

Traitement dont l’efficacité ne doit pas quant à elle être renforcée par des produits concomitants pour éviter de surestimer son effet propre. Le but est donc de maximiser la différence entre les deux traitements pour pénaliser au maximum le traitement expérimental (approche conservatrice). Une analyse en intention de traiter peut justement avoir alors tendance à sous-estimer l’efficacité du traitement de référence. Il vaut donc mieux privilégier une analyse per protocole qui ne porte que sur les patients traités en conformité avec le protocole et qui est plus conservatrice, c’est-à-dire qu’elle aura plus tendance à ne pas rejeter l’hypothèse de non-infériorité et à mettre en évidence un défaut d’efficacité du traitement expérimental.

Et par rapport à la supériorité ?

Un essai de non-infériorité n’est pas le sauvetage d’un essai de supériorité non concluant ou comme une adaptation de la méthode pour un échantillon de petite taille. Il doit s’inscrire dans la validation d’une perte d’efficacité acceptable d’une stratégie thérapeutique qui présente de réels avantages d’administration, de coût ou de tolérance. Comme on a pu le voir plus haut, il s’agit là d’essais à la méthodologie statistique particulière, originale voire même élégante dans l’écriture du test d’hypothèses et l’approche par intervalles de confiance. Quoi qu’il en soit, l’utilisation de ce genre de constructions pour tester la supériorité est envisageable mais doit être prévue au protocole pour contrôler la dépense du risque α, puisqu’il faut procéder de manière hiérarchique et donc faire deux tests successivement : d’abord la non-infériorité et ensuite, la supériorité.

Extension à l’essai d’équivalence

L’approche de non-infériorité est une situation de type unilatéral, car elle s’intéresse à savoir si un nouveau traitement n’est pas inférieur à celui de référence. Plus globalement, il s’agit d’une équivalence dite « unilatérale à gauche », à opposer à la « bilatérale » avec laquelle on la confond par abus de langage. En effet, entreprendre un test bilatéral d’équivalence, pour évaluer une équivalence aussi bien « à gauche » que « à droite » et pas seulement de non-infériorité, mais également de « non-supériorité » (même si le terme n’est jamais utilisé en pratique), peut même conduire à considérer le traitement expérimental comme non équivalent au standard, car tout simplement… supérieur ! Explications. Dans un tel essai, le test d’hypothèses devient alors :

H0: Δ ≤ -Δ_eqou Δ ≥ Δ_eq, i.e. le traitement expérimental est non équivalent au standard H1: – Δ_eq< Δ < Δ_eq, i.e. le traitement expérimental est équivalent au standard

Toujours avec une démarche basée sur l’intervalle de confiance de Δ, mais cette fois bilatérale à 95 %, on conclura alors à l’équivalence si cet intervalle est totalement inclus dans ]- Δ_eq; Δ_eq[, comme illustré sur la figure 2. L’équivalence est une propriété plus difficile à mettre en évidence que la non-infériorité et comme dit plus haut, plus délicate à interpréter selon son sens.

Elle constitue également une démarche moins fréquente et moins utilisée que la non-infériorité.

Figure 2 : essai d”équivalence.

Pour aller plus loin :

Blackwelder WC. “Proving the null hypothesis” in clinical trials. Controlled Clinical Trials;3:345–353. 1982.
Jones B et al. Trials to assess equivalence: the importance of rigorous methods. BMJ;313:36-9. PMID. 1996.
Makuch R, Johnson M. Issues in planning and interpreting active control equivalence studies. J Clin Epidemiol;42:503-1.PMID. 1989.

Auteur/autrice

HematoStat.net (M)

Voir toutes les publications

Page précédente

Page suivante

Non-infériorité et équivalence

Auteur/autrice

Laisser un commentaire Annuler la réponse

Ces articles pourraient également vous intéresser

Le modèle de Royston-Parmar pour les hazard-ratios temps-dépendants

La pondération inverse (ou IPTW), une technique alternative à l’appariement par score de propension

Les essais randomisés multi-bras de phase 3