5. Diagnóstico

Autores: Laura Palomo, Vall d’Hebron Institute of Oncology, Barcelona; Bárbara Tazón, Hospital Universitari Vall d’Hebron, Barcelona; Josep Nomdedéu, Hospital de la Santa Creu i Sant Pau, Barcelona; Iria Vázquez, CIMA LAB Diagnostics Universidad de Navarra, Pamplona; Maria Moreno Igoa, CIMA LAB Diagnostics Universidad de Navarra, Pamplona; Alberto Valiente, Complejo Hospitalario de Navarra, Pamplona; Sofía Toribio, Centro de Investigación del Cáncer, Hospital Universitario de Salamanca; Maria Hernández, Hospital Universitario de Salamanca; Mónica del Rey, Centro de Investigación del Cáncer, Hospital Universitario de Salamanca; Marta Martín-Izquierdo, Centro de Investigación del Cáncer, Hospital Universitario de Salamanca; Rocio Salgado, Hospital Universitario Fundación Jiménez Díaz, Madrid; Mireia Atance, Hospital Universitario Fundación Jiménez Díaz, Madrid; Teresa Arquero, Hospital Universitario Fundación Jiménez Díaz, Madrid; María José Cortti, Hospital Universitario Fundación Jiménez Díaz, Madrid; Antonieta Molero, Hospital Universitari Vall d’Hebron, Barcelona; Javier Grau, Institut Català d’Oncologia, Badalona; Esperanza Tuset, Institut Català d’Oncologia, Girona; Elvira Mora, Hospital Universitari i Politècnic La Fe, Valencia; María José Larráyoz, CIMA LAB Diagnostics Universidad de Navarra, Pamplona; María José Calasanz, CIMA LAB Diagnostics Universidad de Navarra, Pamplona; Andrés Jerez, Hospital General Universitario Morales Meseguer, Murcia.

  • Para la estandarización del estudio de CHIP se deben adoptar unos criterios diagnósticos homogéneos (1A).
  • Los genes más frecuentemente mutados en los estudios publicados hasta ahora son los reguladores epigenéticos (DNMT3A, TET2 y ASXL1).
    Se propone un conjunto de genes y regiones para un análisis completo de CHIP basado en una revisión bibliográfica exhaustiva (1B).
  • La técnica que ofrece la mejor relación coste-efectividad es la secuenciación masiva (NGS) dirigida que, además, es la metodología de mayor implantación en el ámbito clínico para el estudio en profundidad de marcadores moleculares implicados en neoplasias hematológicas (1A).
  • Aunque en la definición de CHIP se incluye cualquier alteración somática independientemente de su categorización (patogenicidad), se recomienda clasificar y categorizar las alteraciones moleculares (1C). Para tal fin, se proponen numerosas herramienta que permiten una buena categorización de las variantes detectadas en los estudios de NGS.

Introducción y genes descritos en individuos con chip

La detección de una HC vendrá determinada por una serie de factores, incluyendo la profundidad de cobertura de la secuenciación, el número de genes (o regiones) analizados, la sensibilidad de la metodología, la correcta eliminación de los artefactos de secuenciación, etc. Por ello, y dadas las implicaciones clínicas derivadas de la HC, es necesario unificar y estandarizar los criterios utilizados para su definición.

Los primeros estudios de secuenciación llevados a cabo en grandes poblaciones de individuos aparentemente sanos, y que describían el fenómeno de la hematopoyesis clonal asociada a la edad, utilizaban datos de exoma y se focalizaban principalmente en genes driver o iniciadores, previamente asociados a cáncer.1,2,3 Fue en estos trabajos donde se observó que la gran mayoría de mutaciones detectadas en sangre periférica, y que daban lugar a una HC, afectaban a genes descritos en neoplasias hematológicas, principalmente de la línea mieloide. Estas mutaciones incluían tanto variantes puntuales (SNVs, de single nucleotide variants) como pequeñas inserciones y deleciones (indels).

Estos estudios detectaban HC en el 2-4% de los individuos estudiados, siendo ésta muy poco frecuente (< 1%) en aquellos individuos menores de 40 años, pero mucho más recurrente a partir de los 70 años (? 10%). Estudios posteriores describen un porcentaje mayor (12%) de HC en la población global estudiada a través de datos de genomas completos, donde identificaban la HC en base a la acumulación de mutaciones somáticas en un clon hematopoyético dominante, independientemente del gen o la región del genoma que se viera afectada por dichas mutaciones.4

La frecuencia de la HC también varía en función de la naturaleza de la cohorte estudiada. Por ejemplo, estudios llevados a cabo en cohortes de pacientes con cáncer (tumores sólidos) detectan hasta un 25?30% de casos con HC en el total de la serie analizada.5,6 Los factores que contribuyen a esta frecuencia mayor no están completamente definidos, pero podrían incluir la edad, el tabaco y la exposición a terapia oncológica.5,6 Asimismo, a HC también es más frecuente (35?50%) en aquellos individuos que presentan ICUS,7,8 o en pacientes con anemia aplásica (65-70%).9, 10

De forma similar, la prevalencia de la HC también se puede ver afectada por la sensibilidad de la técnica utilizada y por el punto de corte de la VAF considerada para establecer la clonalidad. El uso de técnicas más sensibles permite detectar clones mucho más pequeños que los observados en los estudios iniciales.11,12 De hecho, un estudio llevado a cabo utilizando secuenciación ultra profunda (detección de VAFs de hasta 0,03%) concluyó que, a partir de los 50 años de edad, prácticamente todos los individuos presentan HC.11 Sin embargo, la relevancia biológica y clínica de estos clones tan minoritarios se desconoce, por lo que es importante establecer un punto de corte en función del objetivo del estudio planteado y, sobre todo, para la consideración de la HC en la práctica clínica.

Basándonos en la evidencia disponible y con el objetivo de destacar las consecuencias clínicas de la HC, en esta guía se propone utilizar los criterios de definición de CHIP, término propuesto por Steensma y colaboradores en 2015 y utilizado en la gran mayoría de trabajos llevados a cabo desde entonces13 y que se detallan en el capítulo 4.

Teniendo en cuenta que el número de genes recurrentemente mutados en las neoplasias hematológicas es muy extenso y que los principales actores implicados en la CHIP ya han sido identificados, proponemos un panel de genes mínimo a tener en cuenta para estudiar la CHIP (Tabla 1).

Gen Frecuencia (PS) Frecuencia (PC) Regiones (exones) Tránscrito Hotspots
DNMT3A 1,57% 10-12% todos NM_022552.4 R882
TET2 0,46% 3-8% todos NM_001127208.2
ASXL1 0,28% 1-2% 9-13 NM_015338.6
JAK2 0,15% <0,5% 12,14 NM_004972.3 V617F
PPM1D 0,14% 1,00% 4-6 NM_003620.4
TP53 0,13% 0,50% todos NM_000546.5
SF3B1 0,11% 0,50% 10-16 NM_012433.3 K700E, K666N
GNB1 0,07% <0,5% 5 NM_002074.5 K57
SRSF2 0,06% <0,5% 1 NM_003016.4 P95
CHEK2 <0,5% todos NM_007194.4
CBL 0,04% <0,1% 8-9 NM_005188.4
KMT2D 0,04% <0,1% todos NM_003482.3
GNAS 0,03% <0,1% 8 NM_000516.6 R201
NRAS 0,03% <0,1% 2-3 NM_002524.5 G13, Q61
CUX1 0,02% <0,1% todos NM_001913.5
RAD21 0,02% <0,1% todos NM_006265.3
SETD2 0,02% <0,1% todos NM_014159.6
U2AF1 0,02% <0,1% 2-7 NM_001025204.1 S34F, R156H
BCOR 0,02% <0,1% todos NM_017745.6
ZRSR2 0,02% <0,1% todos NM_005089.3
IDH2 0,01% <0,1% 4 NM_002168.3 R140Q
STAT3 0,01% <0,1% 19-22 NM_139276.2 D661Y
MYD88 0,01% <0,1% 3-5 NM_002468.5 L265P
EZH2 0,01% <0,1% todos NM_004456.5
SF1 0,01% <0,1% todos NM_201995.2
MPL 0,01% <0,1% todos NM_005373.3 W515L
CREBBP 0,01% <0,1% todos NM_004380.3
ATM 0,01% <0,1% todos NM_004380.3
KIT 0,01% <0,1% 2, 8-14, 17 NM_000222.2
PTPN11 0,01% <0,1% todos NM_002834.4
SETBP1 0,01% <0,1% 4 NM_015559.3
SH2B3 0,01% <0,1% 2-8 NM_005475.3
IDH1 <0,1% 4 NM_005896.3
KRAS <0,1% 2-3 NM_033360.4
RUNX1 <0,1% todos NM_001754.4

Abreviaturas: PS, Población sana; PC, Población con cáncer (tumores sólidos).

Tabla 1. Listado de genes propuesto para un estudio completo de la CHIP y regiones que se recomiendan analizar (se incluyen aquellas regiones descritas tanto en individuos con CHIP como en neoplasias hematológicas), ordenados según su frecuencia. Los 10 genes encuadrados en verde son aquellos que se recomienda analizar como mínimo en cualquier estudio de CHIP. Los del recuadro naranja se han descrito de forma recurrente, pero con una menor frecuencia, mientras que los del recuadro azul se han descrito en estudios puntuales o con una frecuencia muy baja.

La gran mayoría de los genes recurrentemente mutados en la CHIP se pueden englobar en 3 categorías: reguladores epigenéticos, factores de splicing y genes implicados en la respuesta del daño al ADN. Otros genes detectados con menor frecuencia son aquellos que codifican para componentes de vías de señalización y transducción, factores de transcripción y miembros del complejo de la cohesina.16 La Figura 2 muestra la frecuencia de dichos genes en el conjunto de individuos con CHIP. Las mutaciones que afectan a estos genes y que juegan un papel en la CHIP son de tipo iniciador, y suelen promover un aumento muy sutil en el fitness y la capacidad de autorrenovación de las células madre hematopoyéticas, generando una pequeña expansión clonal que, en la mayoría de los casos, se mantendrá en niveles muy bajos. En un reducido número de individuos, otras alteraciones como la adquisición de mutaciones adicionales, contribuirán a una mayor expansión clonal y al desarrollo de una neoplasia en última instancia.

Las mutaciones que podemos detectar en estos genes pueden ser de tipo missense (cambio de aminoácido), nonsense (generación de un codón de parada prematuro que mayoritariamente trunca la proteína), frameshift (que alteran la pauta de lectura y mayoritariamente truncan la proteína) o de splicing (cuando afectan al procesamiento del ARN).

Figura 2. Genes recurrentemente mutados en individuos con CHIP. Modificado de Challen GA, et al.16

Reguladores epigenéticos

Los reguladores epigenéticos son genes implicados en procesos que modifican la expresión del ADN sin alterar su secuencia. Son los genes más frecuentemente mutados en la CHIP (constituyen >70% de las mutaciones detectadas; Figura 1) y podemos dividirlos en genes implicados en la metilación del ADN (DNTM3A, TET2, IDH1/2) y genes modificadores de la cromatina y las histonas (ASXL1, EZH2, KMT2D). Se encuentran principalmente afectados por mutaciones truncantes que suelen afectar a toda la región codificante del gen y que conllevan una pérdida de función de la proteína, a excepción de IDH1/2, que presentan mutaciones missense puntuales que afectan a posiciones hotspot. Los reguladores epigenéticos se encuentran recurrentemente mutados en diversas neoplasias hematológicas, sobretodo de naturaleza mieloide (SMD, neoplasias mielodisplásicas/mieloproliferativas [SMD/NMP] y, con menor frecuencia, LMA y neoplasias mieloproliferativas [NMP]), pero también en algunas neoplasias linfoides como el linfoma difuso de células grandes B, la leucemia aguda linfoblástica T y los linfomas de células T. En concreto, los denominados genes DTA (DNMT3A, TET2 y ASXL1) son claramente los actores principales en la CHIP (Figura 1).

DNMT3A
El gen DNMT3A codifica para un enzima con actividad metiltransferasa y cataliza la adición de un grupo metil en el residuo de citosina de los dinucleótidos CpG, jugando un papel en la regulación de la expresión génica. Es el gen más frecuentemente mutado en la CHIP, detectado en casi el 50% de los casos.1,2,3

Las mutaciones de DNMT3A son monoalélicas, se localizan en toda la región codificante del gen y conllevan una pérdida de función. Más de la mitad de las mutaciones son de tipo truncante (frameshift, nonsense), pero también se detectan con frecuencia mutaciones missense (en su mayoría generan nuevos residuos de cisteína) y de splicing.1,2 Experimentos funcionales demuestran que la pérdida de la proteína DNMT3A daña la diferenciación de las células madre hematopoyéticas y aumenta la capacidad de autorrenovación de estas células.14 Modelos murinos con pérdida de función de DNMT3A muestran que las células hematopoyéticas mutadas tienen patrones de metilación alterados en genes de pluripotencia, lo que confiere a la célula una ventaja competitiva respecto a las células no mutadas. De manera similar a lo que pasa en individuos con CHIP, los ratones raramente acaban desarrollando un cáncer y, si lo hacen, es después de un largo periodo de latencia.14,15

El espectro de mutaciones de DNMT3A visto en la CHIP es algo distinto al observado en las neoplasias mieloides, estando mucho menos enriquecido en la variante R882H, que es la más frecuentemente detectada en la LMA (15% de los casos con CHIP).5,16 Esta variante tiene un efecto dominante negativo por lo que, aunque el alelo no mutado se sigue expresando, la actividad funcional de la proteína DNMT3A podría verse reducida a tan solo un 20% de los niveles normales. En cambio, mutaciones en otros dominios de la proteína podrían reducir la actividad a un 50%, contribuyendo a una menor expansión clonal, típica en la CHIP, mientras que los individuos con la variante R882H podrían estar más predispuestos a desarrollar una neoplasia.17

TET2

El gen TET2 codifica para un miembro de la familia de proteínas TET, cuya actividad enzimática cataliza la conversión de la 5-metil-citosina a 5-hidroximetil-citosina. Es el segundo gen más recurrente en la CHIP, afectando aproximadamente al 15% de los casos.1,2,3 Las mutaciones de TET2 son similares a las descritas en neoplasias hematológicas, principalmente variantes de tipo frameshift, nonsense, y de splicing en menor frecuencia, que afectan a toda la región codificante del gen y que conllevan una pérdida de función de la proteína. Estudios funcionales demuestran que la pérdida de TET2 conlleva un aumento en la capacidad de autorrenovación de las células madre hematopoyéticas y una ventaja competitiva en su crecimiento. De forma paralela a lo que sucede con las mutaciones de DNMT3A, los modelos murinos con pérdida de función de TET2 sugieren que estas mutaciones por sí solas promueven la expansión clonal de las células madre hematopoyéticas, pero no son suficientes para iniciar un proceso neoplásico.18,19

ASXL1

El gen ASXL1 codifica para una proteína nuclear reguladora de la transcripción y la cromatina, que actúa mediante la interacción con el complejo represivo polycomb (PRC2) y con activadores y represores de la transcripción. Las mutaciones de ASXL1 se detectan aproximadamente en un 7% de los individuos con CHIP.1,2,3

Similar a lo descrito en neoplasias mieloides, las mutaciones de ASXL1 detectadas en la CHIP son variantes de tipo frameshift, nonsense, y de splicing en menor frecuencia, que afectan principalmente al último exón del gen, y que generan una proteína truncada con pérdida de función.1 De forma similar a lo que ocurre con DNMT3A y TET2, se cree que las mutaciones en ASXL1 probablemente conlleven también un aumento de la capacidad de autorrenovación de las células madre hematopoyéticas, aunque los mecanismos no están claros.16

Como dato interesante, un estudio HC al llevado a cabo en pacientes con diversos tumores sólidos, detectó una asociación positiva entre individuos fumadores y la presencia de mutaciones en ASXL1.6

Factores de splicing

El espliceosoma es un gran complejo proteico involucrado en el proceso de splicing, cuya función es eliminar los intrones del pre-ARN mensajero para generar el ARN mensajero maduro durante el proceso de la transcripción genética. Los factores de splicing, que codifican para proteínas de este complejo, se encuentran recurrentemente mutados en las neoplasias mieloides y se asocian a la presencia de mielodisplasia, por lo que son especialmente recurrentes en los SMD y los SMD/NMP. Además, las mutaciones en SF3B1 también se han descrito en la leucemia linfática crónica.

La prevalencia de mutaciones en factores de splicing en individuos con CHIP es muy inferior en comparación a los reguladores epigenéticos, afectando de forma global al 6% de los casos, aproximadamente (Figura 1). Los genes más frecuentemente afectados son SF3B1 y SRSF2, seguidos de U2AF1, ZRSR2 y SF3A1.16 Igual que sucede en las neoplasias hematológicas, las mutaciones descritas en estos genes son mayoritariamente monoalélicas, de tipo missense, se localizan en regiones hotspot definidas y generalmente son mutuamente excluyentes.1,2,3

Modelos murinos para algunas de las mutaciones más frecuentes en estos genes no han podido reproducir la expansión clonal observada en humanos, por lo que los mecanismos que dan lugar a esta expansión y contribuyen a la HC se desconocen.20 Estudios de HC en pacientes con cáncer han demostrado que las mutaciones en SF3B1 y SRSF2 son las que muestran una mayor asociación con la edad.6 Por otro lado, estudios de HC en pacientes con citopenias de significado incierto demostraron que la presencia de mutaciones en factores de splicing se asociaba a un mayor riesgo de desarrollar una neoplasia mieloide.8

Genes de reparación del daño en el ADN

La respuesta al daño en el ADN (DDR, de DNA damage response) comprende una red compleja de mecanismos y procesos altamente regulados, incluyendo vías de reparación del ADN, procesos de tolerancia al daño del ADN y checkpoints del ciclo celular destinados a mantener la integridad genómica. Se han descrito mutaciones recurrentes en individuos con CHIP en algunos genes implicados en la DDR, principalmente TP53 y PPM1D (Figura 1).1,2,3

Además, en pacientes con tumores sólidos también se han descrito, aunque con menor frecuencia, casos con CHIP con mutaciones de CHEK2, un gen que codifica para un regulador de un checkpoint del ciclo celular. 5,6

TP53

El gen TP53 codifica para una proteína supresora tumoral que también funciona como factor transcripcional y que, en situaciones de estrés celular regula la expresión de genes involucrados en arresto del ciclo celular, apoptosis, senescencia, reparación del ADN y cambios en el metabolismo de la célula. TP53 se encuentra mutado en el 3-4% de los individuos con CHIP.16 Es el gen más frecuentemente mutado en cáncer y, en las neoplasias hematológicas, se puede encontrar mutado prácticamente en todas las entidades, tanto mieloides como linfoides, aunque la prevalencia es muy variable. En los individuos con CHIP, así como en las neoplasias hematológicas, la mayoría de mutaciones de TP53 son de tipo missense y afectan principalmente al dominio de unión al ADN, con numerosos hotspots descritos.1,2,3 Las mutaciones alteran la función normal de la proteína p53, afectando así a la supervivencia y la proliferación celular. Modelos murinos demuestran que las células madre con mutaciones de TP53 pueden entrar en el ciclo celular, aunque haya daño en el ADN, resultando en una ventaja celular que promueve la expansión clonal.21

PPM1D

El gen PPM1D codifica para una fosfatasa de la familia de fosfatasas PP2C, que son reguladores negativos de vías de respuesta al estrés y daño celular. En concreto, la expresión de PPM1D se induce de forma p53-dependiente en respuesta a diferentes señales de estrés del entorno. La identificación y prevalencia de mutaciones en PPM1D en la CHIP (1-2% de los individuos con CHIP) fue inicialmente una sorpresa, puesto que este gen se ha descrito en algunos tumores sólidos, pero no se encuentra recurrentemente mutado en las neoplasias hematológicas, aunque en estudios recientes se han identificado mutaciones en este gen en casos con neoplasias mieloides relacionadas con el tratamiento (NMRT), en concreto LMA.1,4,22

Las mutaciones en PPM1D en individuos con CHIP son mayoritariamente mutaciones de tipo frameshift, nonsense o de splicing que afectan al último exón del gen, dando lugar a una proteína truncada, igual que se ha visto en tumores sólidos.1,4,5 Son mutaciones que generan una ganancia de función, puesto que la pérdida del dominio C-terminal de PPM1D activa constitutivamente la proteína, lo que resulta en una represión de p53, afectando al checkpoint G1 del ciclo celular, que es p53 dependiente, y promoviendo así la proliferación. Como pasa con TP53, modelos murinos con mutaciones en PPM1D demuestran que las células madre con este tipo de mutaciones entran en el ciclo celular independientemente del daño en el ADN.24,25

De forma global, la ventaja proliferativa que se observa en las células madre con mutaciones en genes de DDR (TP53, PPM1D o CHEK2) se hace evidente cuando hay un daño celular, como por ejemplo en el contexto del tratamiento con fármacos citotóxicos.6,24 De hecho, se ha visto que la exposición previa a tratamiento con radioterapia o quimioterapia en pacientes con cáncer se asocia a una mayor probabilidad de tener CHIP, especialmente con mutaciones en estos tres genes.5,6 Se ha demostrado que, en pacientes sometidos a tratamiento con radioterapia o quimioterapia citotóxica, los clones CHIP con mutaciones en genes de DDR crecen más rápido en comparación con otros clones CHIP presentes en el mismo paciente, pero portadores de otras mutaciones, por lo que los clones DDR se seleccionan bajo esta presión. En cambio, en pacientes no tratados, clones con mutaciones en genes no-DDR (por ejemplo, DNMT3A) muestran una ventaja en el crecimiento en comparación con los clones con mutaciones de DDR.6 Otros genes con funciones similares pero mutados con menor frecuencia en individuos con CHIP, como ATM, podrían jugar papeles similares.16

Es importante tener estos datos en cuenta porque la presencia de CHIP en individuos con cáncer es clínicamente relevante, asociándose a un peor pronóstico.6 Cabe destacar que los pacientes con tumores sólidos y CHIP tienen un mayor riesgo de desarrollar una NMRT, y esta asociación es particularmente evidente en el caso de mutaciones en TP53, altamente prevalentes en las NMRT.26,27,28

Genes implicados en vías de señalización

Las vías de señalización celular son las encargadas de regular la proliferación y la apoptosis celular mediante cascadas de señales, cuyos principales componentes son enzimas de tipo tirosina quinasa. Las mutaciones en los transductores de estas señales dan lugar, generalmente, a una activación constitutiva de la vía correspondiente y un incremento en la proliferación celular. Las mutaciones en genes implicados en vías de señalización son muy prevalentes tanto en tumores sólidos como en neoplasias hematológicas, especialmente mieloides, ya que promueven la proliferación de las células neoplásicas. Quizás por eso son poco frecuentes en individuos con CHIP, donde prevalecen las mutaciones que aumentan la capacidad de autorrenovación de las células madre hematopoyéticas y confieren una ventaja proliferativa mucho más sutil. Sin embargo, cabe destacar que el gen JAK2 se encuentra entre los genes más frecuentemente mutados en la CHIP (3-4% de los individuos con CHIP). Además, también se han descrito mutaciones menos frecuentes (1-2%) en genes implicados en la vía RAS (GNB1, CBL, NRAS, KRAS, PTPN11) (Figura 1).16 Finalmente, otro gen que juega un papel en el crecimiento celular y que se encuentra mutado en una pequeña proporción (1%) de individuos con CHIP es GNAS. Las mutaciones que afectan a todos estos genes implicados en vías de señalización son de tipo missense, afectan a hotspots concretos y generan una ganancia de función de la proteína.

JAK2

El gen JAK2 codifica para una tirosina quinasa de la familia JAK. Estas tirosinas están involucradas en la vía de señalización JAK/STAT mediante la interacción con los dominios citosólicos de los receptores de citoquinas de la vía y JAK2, en particular, juega un papel en la señalización vía citoquinas hematopoyéticas involucradas en la mielopoyesis. JAK2 se encuentra mutado en el 3-4% de los individuos con CHIP,16 así como en algunas neoplasias mieloides, siendo especialmente prevalente en las NMP Filadelfia negativas.

Como sucede para la mayoría de genes implicados en vías de señalización, las mutaciones de JAK2 descritas en individuos con CHIP son de tipo missense y afectan a posiciones específicas, en concreto el codón 617 del gen (mutación V617F), que es el mismo que se ve principalmente afectado en las neoplasias mieloides.1,2,3 Esta mutación tiene como consecuencia la activación constitutiva de la vía JAK/STAT, promoviendo así la expansión clonal.

Cabe destacar que la CHIP se asocia a un mayor riesgo de tener un accidente cardiovascular y que, en concreto, los individuos con CHIP con mutación de JAK2 y una VAF>10% parecen tener un particular riesgo aumentado de sufrir este tipo de eventos.29

Componentes del complejo de la cohesina

El complejo multiproteico de la cohesina está involucrado en la cohesión de las cromátidas hermanas y la reparación post-replicativa del ADN, y está codificado por los genes RAD21, STAG1, STAG2, SMC1A y SMC3. En conjunto, mutaciones en estos genes se detectan aproximadamente en el 0,6% de los individuos con CHIP (Figura 1).16 Estos genes se encuentran recurrentemente mutados en una pequeña proporción de neoplasias mieloides (LMA, SMD y SMD/NMP). En estos pacientes, las mutaciones en STAG2 son las más prevalentes, mientras que, en individuos con CHIP, las pocas mutaciones descritas afectan principalmente al gen RAD21.2

Las mutaciones en los genes de la cohesina suelen ser truncantes de tipo frameshift, nonsense y de splicing y no se localizan en una región concreta del gen.2 Se desconoce el mecanismo mediante el cual las mutaciones de RAD21 promueven la expansión clonal en individuos con CHIP, pero modelos murinos con mutaciones de STAG2 indican que el efecto podría ser parecido al de las mutaciones en reguladores epigenéticos, ya que dan lugar a un aumento en la expresión de genes que promueven la autorrenovación de las células madre hematopoyéticas y una disminución en la expresión de genes que promueven la diferenciación celular.16

Muestra de estudio

La muestra para el estudio de CHIP será, por definición, la sangre periférica (SP). Hasta el momento, prácticamente todos los estudios de HC han sido realizados en sangre periférica, ya fueran en población sana o con alguna patología no hematológica (tumores sólidos, diabetes, enfermedad cardiovascular, enfermedad psiquiátrica y otras).

Métodos de preparación de la muestra

El estudio molecular se llevará a cabo en ADN procedente de las células totales nucleadas de la sangre periférica. Se recomiendan los siguientes métodos para el procesamiento de la muestra.

Buffy coat: este método consiste en obtener la capa de células leucoplaquetaria mediante centrifugación. Para ello, se centrifuga el tubo de SP total (por ej. 10 minutos a 1.500g, a temperatura ambiente y con el freno desactivado) para obtener 3 capas: el plasma (capa superior amarillenta, aproximadamente un 55% de la SP), el buffy coat (capa fina intermedia blanquecina que contiene los leucocitos y las plaquetas, <1% de la SP) y los eritrocitos (capa inferior rojiza, aproximadamente un 45% de la SP). Se recoge con una pipeta la capa intermedia de buffy coat y se realiza una lisis eritrocitaria. Finalmente, se centrifuga la muestra y se lava (generalmente con un tampón fosfato salino/PBS) para la obtención de un pellet celular. Lisis eritrocitaria: este método consiste en realizar una lisis de eritrocitos directamente en la muestra de SP y así obtener un pellet de células totales nucleadas. Existen diferentes soluciones/tampones que se pueden utilizar, la mayoría de los cuales se basan en el uso de la sal de cloruro de amonio, que promueve la rotura de la membrana celular de los eritrocitos. El procesamiento es sencillo y consiste en incubar la SP con una proporción adecuada del tampón y posteriormente centrifugar y lavar (generalmente con un tampón fosfato salino/PBS) para la obtención de un pellet celular.

Una vez obtenido un pellet de células mediante alguno de estos métodos se llevará a cabo una extracción de ADN. En la Guía de aplicación clínica de la secuenciación masiva en SMD y LMMC (GESMD, 2017) se detallan algunos de los métodos más habituales de extracción de ADN.

Estudio de chip mediante un panel de NGS

Para el estudio de la CHIP se puede hacer uso de diferentes técnicas moleculares. Teniendo en cuenta las características de las principales técnicas disponibles (sensibilidad, especificidad, cantidad de información que proporcionan, rendimiento, coste-efectividad, etc.) la secuenciación masiva (NGS, Next Generation Sequencing) dirigida a un panel de genes conocidos probablemente sea la técnica más adecuada. Por ello, las características de esta técnica se describen con mayor detalle en este capítulo. La NGS hace referencia a aquellas tecnologías de alta capacidad basadas en la secuenciación masiva en paralelo de millones de moléculas de ADN. Las técnicas de NGS de segunda generación son las que se utilizan hoy en día de forma más extensa. Las secuencias o lecturas tienen un tamaño de 50 – 400 pb, por lo que este tipo de tecnologías también se conoce como secuenciación de lecturas cortas.30,31 Esta secuenciación proporciona los datos que combinan una mayor precisión con un menor coste, por lo que son ideales para su uso en el ámbito clínico.

Las aplicaciones de la NGS son numerosas y nos permiten obtener información a nivel de ADN (secuenciación de genomas/exomas/paneles, metagenómica, metilación del ADN), de ARN (secuenciación del transcriptoma, perfiles de expresión génica, perfiles de ARN de pequeño tamaño) y de proteína (perfil ribosómico, ChIP (chromatin immunoprecipitation)-Seq). En el ámbito asistencial, la aplicación más utilizada es la secuenciación de ADN mediante paneles de genes dirigidos.

La secuenciación masiva dirigida es una técnica que permite realizar un cribado masivo de los genes más relacionados con la patología de interés de una manera rápida y sencilla.32 Esta estrategia de secuenciación está principalmente enfocada a la detección de mutaciones (SNVs e indels). Sin embargo, según cómo se realice el diseño del panel de genes y según la química utilizada, también puede permitir llevar a cabo un análisis de CNVs. Este tipo de técnicas requiere una cantidad no muy elevada de ADN de partida (50-200 ng aproximadamente), aunque éste debe ser de gran calidad.33 Esta técnica permite cuantificar la frecuencia de las alteraciones identificadas, por lo que permite medir el tamaño del clon y valorar su posible impacto cualitativo y también cuantitativo. Además, gracias a la selección de los genes o regiones de interés, con esta técnica se obtiene una cobertura más uniforme y completa que las obtenidas con otras técnicas de NGS. En cuanto a la sensibilidad de la técnica, puede ser muy variable y dependerá de la profundidad de cobertura a la que se elija secuenciar. La selección de genes permite un análisis más rápido, económico y fácil de interpretar que el de otras técnicas de secuenciación masiva, como la secuenciación de exomas o de genomas completos.32,33,34 No obstante, la selección de los genes a estudio requiere dedicar un mayor esfuerzo al diseño del panel y a la preparación de las muestras, así como una mayor comunicación entre los expertos del laboratorio y la clínica para elegir las regiones de interés.

Plataformas y preparación de librerías
Los métodos de NGS de lecturas cortas se dividen, de forma general, en métodos de secuenciación por ligación (sequencing by ligation, SBL) y métodos de secuenciación por síntesis (sequencing by synthesis, SBS). A la hora de elegir una plataforma de secuenciación se deben tener en cuenta diversos factores, como el tiempo de cada carrera, el tamaño de la región a secuenciar, la profundidad de cobertura deseada, la longitud de lectura, los requerimientos de tiempo de respuesta y el coste.30 Teniendo en cuenta estos factores, el GESMD recomienda los métodos de SBS de Illumina y de ThermoFisher. Estas plataformas son las más utilizadas en el ámbito clínico y sus principales características (química utilizada, precisión, tasas de error, etc.) se describen con mayor detalle en las Guía de aplicación clínica de la secuenciación masiva en SMD y LMMC (GESMD, 2017).

El material de partida para cualquier plataforma de NGS es una librería de ADN. Una librería es un conjunto de fragmentos de ADN de un tamaño determinado y que tienen ligado, en sus extremos, unos oligonucleótidos denominados adaptadores, cuya secuencia dependerá de la plataforma de secuenciación que se vaya a utilizar. Además de los adaptadores, los fragmentos de las librerías podrán ir también marcados con una secuencia llamada índice (barcode), y que será específica de cada muestra. Este índice permite mezclar (multiplexar) diferentes muestras en una misma carrera de un secuenciador, para poder aprovechar al máximo su capacidad.

El proceso de preparación de librerías puede llevarse a cabo mediante diferentes métodos y su elección dependerá de diversos factores, incluyendo: la plataforma de secuenciación, el tamaño de la librería, el tiempo de respuesta diagnóstica y el coste de secuenciación.

En concreto, la secuenciación dirigida de un panel de genes requiere que durante el proceso de preparación de la librería se enriquezca en fragmentos de ADN que correspondan a las regiones de interés. Para ello existen principalmente dos estrategias: los paneles de amplicones (basados en el uso de cebadores, primers, para la amplificación por PCR) y los paneles de captura (basados en el uso de sondas complementarias a las regiones de interés). En la Guía de aplicación clínica de la secuenciación masiva en SMD y LMMC se describen y se comparan con mayor detalle ambas estrategias (GESMD, 2017).

Cuando el objetivo del panel de NGS es la detección de mutaciones a baja frecuencia, como es el caso del estudio de la CHIP, es interesante considerar metodologías que permitan detectar estas mutaciones de forma fiable. La estrategia más extendida, válida tanto para paneles de amplicones como de captura, es el uso o incorporación de identificadores moleculares únicos (unique molecular barcodes, UMIs) durante la preparación de las librerías. Los UMIs son oligonucleótidos que se ligan a cada fragmento inicial de ADN, sirviendo de marca o identificador. La composición aleatoria de la secuencia de los UMIs asegura que cada combinación de fragmento-UMI sea única dentro de la librería. Si no se utilizan UMIs, después del enriquecimiento por PCR no se puede distinguir si las múltiples copias de un fragmento son duplicados de PCR o si son duplicados biológicos reales. Durante el análisis de los resultados, la presencia de estos fragmentos sobrerrepresentados puede traducirse en la detección de variantes artefactuales, especialmente cuando se secuencia a una elevada profundidad de cobertura. En cambio, mediante el uso de UMIs, los duplicados de PCR se pueden identificar buscando combinaciones de fragmento-UMI no únicas y pueden eliminarse.35 El uso de esta estrategia puede ayudar a reducir errores y sesgos cuantitativos, lo que resulta especialmente interesante cuando el objetivo es la detección de variantes con baja frecuencia alélica, como son las variantes que se detectan en los individuos con CHIP.

Alternativamente, se puede utilizar el método bioinformático de agrupamiento de lecturas (read grouping) para eliminar falsos positivos. Brevemente, consiste en alinear las lecturas que comienzan y terminan en una misma posición genómica de forma que esas lecturas quedan aunadas en un grupo o cluster. Para validar una variante debe detectarse en varios clusters, lo que equivaldría a varios UMIs del método comentado anteriormente, asegurándonos así que la variante se encuentra en duplicados biológicos reales (método registrado de SOPHiA Genetics).

Finalmente, a la hora de elegir el panel a secuenciar, se puede escoger entre el uso de un panel prediseñado o comercial, y un panel personalizado o custom. La ventaja principal de los paneles comerciales es que no requieren una etapa de diseño previa y están optimizados, aunque requieren de un pequeño proceso de validación en cada laboratorio. En cambio, los paneles personalizados requieren un trabajo previo en la selección de los genes y las regiones concretas a incluir, y requieren de un proceso de optimización y validación del diseño. Sin embargo, ofrecen mayor flexibilidad, ya que se pueden incluir todas las regiones deseadas y el diseño se puede ir modificando con el tiempo en función de las necesidades. Algunos fabricantes ofrecen la posibilidad de partir de un panel prediseñado y convertirlo en uno personalizado añadiendo regiones extra. Esta opción puede ser especialmente interesante en el caso de CHIP, ya que se puede partir por ejemplo de un panel de genes mieloide prediseñado, al que se le pueden añadir otras regiones asociadas a CHIP. En la Guía de aplicación clínica de la secuenciación masiva en SMD y LMMC se detallan diferentes químicas recomendadas por el GESMD, tanto para paneles prediseñados como para paneles personalizados, y se describen algunos recursos informáticos que pueden ser de gran utilidad para el diseño de estos últimos (GESMD, 2017).

Profundidad de cobertura, sensibilidad y VAF

En NGS, la profundidad de cobertura hace referencia al número de lecturas que cubren una posición determinada (una base nucleotídica o locus concreto) en una región secuenciada.

La VAF o frecuencia alélica de la variante, en porcentaje, se define como el número de lecturas que contiene la variante (cobertura de la variante) dividido por el número de lecturas totales que cubren esa misma posición (cobertura de la posición), multiplicado por 100:

VAF (%) = Cobertura de la variante / Cobertura de la posición x 100

Por ello, cuantas más lecturas cubran una posición, más probabilidad tendremos de detectar variantes que se encuentren en una baja frecuencia y que por tanto sólo estén presentes en unas pocas lecturas. Una mayor profundidad de cobertura permitirá una mayor sensibilidad y robustez al detectar mutaciones con VAF baja.

La profundidad de cobertura es un parámetro que decide el usuario, por lo que debe establecerse previamente a la secuenciación. Dependiendo de la capacidad que tenga el secuenciador que utilicemos y del tamaño del panel a secuenciar, podremos elegir mezclar más o menos muestras para asegurarnos de alcanzar la profundidad de lectura deseada. Para realizar los cálculos necesarios, habrá que decidir cuál es la profundidad de cobertura mínima que se desea alcanzar, y que hace referencia a la cobertura mínima que debería conseguirse para la mayoría de las bases de las regiones secuenciadas para cada muestra. En cualquier caso, frecuentemente será necesario reevaluar la profundidad de cobertura tras los resultados de las primeras muestras secuenciadas con un determinado panel de genes. En la Guía de aplicación clínica de la secuenciación masiva en SMD y LMMC (GESMD, 2017) se explican estos conceptos y proceso con mayor detalle.

Para llevar a cabo un estudio de CHIP hay que tener en cuenta que el objetivo será detectar variantes que estén presentes con VAF ? 2%, por lo que tendremos que asegurarnos de que la profundidad de cobertura a la que secuenciemos permite llegar a esta sensibilidad.

Para llegar a una VAF del 2% se recomiendan las siguientes coberturas:

Cobertura de la posición (>90% de las bases deben estar cubiertas a esta profundidad) VAF (%) = Coberturade de la variante
Panel de amplicones 1.250x 25x
Panel de captura 1.000x 10x

Otras metodologías

Como ya se ha mencionado anteriormente, la NGS dirigida a un panel de genes es probablemente la técnica más adecuada para el estudio de la CHIP, aunque existen otras técnicas que también podrían emplearse y que se describen brevemente a continuación. Algunas de ellas son tecnologías ampliamente utilizadas en el ámbito asistencial (Tabla 2), y otras más restringidas a la investigación.

Metodologías en el ámbito asistencial

• Secuenciación de Sanger

La secuenciación por electroforesis capilar o de Sanger se utiliza fundamentalmente para la secuenciación de mutaciones hotspot o regiones frecuentemente mutadas, con la ventaja que no es necesario el conocimiento previo de las mutaciones concretas que se puedan hallar en la zona analizada. El material de partida debe estar bien purificado (ADN sin restos de ARN o fenoles) y la cantidad necesaria varía entre los 40-80 ng por reacción.

Para regiones pequeñas de ADN tiene una buena relación coste-efectividad36 siendo la NGS, en este caso, más costosa económicamente. Sin embargo, esta técnica resulta muy costosa para la secuenciación de regiones grandes de ADN por lo que, cuando los genes a estudiar contienen muchos exones (como por ejemplo DNMT3A o TET2) probablemente no proporcionará ya un beneficio en cuanto a coste-efectividad en comparación con la NGS.36,37 Además, tampoco permite el análisis de CNVs.

La secuenciación de Sanger es una técnica semicuantitativa, ya que no proporciona un valor de VAF concreto, pero permite tener una idea aproximada de la carga mutacional. Sin embargo, su principal limitación es la menor sensibilidad con respecto a otras técnicas de secuenciación (10-20%), que puede resultar en pérdida de detección de variantes presentes en baja proporción.36,38 Esta es la principal limitación de la secuenciación de Sanger para su uso en estudios de CHIP, donde la población clonal suele suponer una fracción pequeña en el total de células de la muestra y se esperan mutaciones con VAF tan baja como un 2%.

• Secuenciación del exoma (WES)

La secuenciación masiva del exoma completo (WES, de whole exome sequencing) es una técnica que permite obtener información de todas las regiones codificantes(exones) del genoma humano, tanto mutaciones puntuales como CNVs.40 Aunque en los últimos años se han producido grandes avances, aún hoy en día es una técnica que requiere de una elevada cantidad y calidad en el ADN de partida (200-1000 ng). Además, debido a la gran cantidad de datos que se generan, su análisis puede resultar laborioso, requiriendo más tiempo y personal más especializado que otras técnicas convencionales.39,40,41 En cuanto a la sensibilidad, un exoma se suele secuenciar a una profundidad de 50-100x lo que permite detectar variantes con VAF > 10%, aumentar esta sensibilidad conllevará un coste muy elevado.39 Por todas estas razones, la WES no suele aplicarse al estudio de CHIP en el ámbito clínico.

• PCR cuantitativa (qPCR)

La PCR cuantitativa (qPCR, de quantitative polymerase chain reaction) es una metodología que presenta una alta sensibilidad y especificidad para la detección de mutaciones.42 Además, el flujo de trabajo es sencillo y rápido. El material de partida (ADN o cADN obtenido a partir de ARN), aunque puede proceder de muestra fresca o congelada, debe tener unos valores mínimos de calidad, por lo que es preciso evaluar su pureza. La cantidad mínima de ADN de partida suele ser bajo (llegando a valores como 1 ng) pero dependerá del método utilizado. Esta técnica nos permite no sólo detectar la presencia de mutaciones, sino además cuantificarlas, lo que nos da una medida de la carga tumoral presente en la muestra de estudio (sensibilidad de hasta 0,1%). Las técnicas de qPCR permiten cuantificar de forma absoluta o relativa, según la estrategia empleada, pero no proporcionan un valor de VAF equivalente al que se obtendría mediante técnicas de NGS. Por ello, se debe tener cuidado a la hora de intentar extrapolar o comparar la carga alélica obtenida mediante qPCR a la VAF.

Su principal inconveniente es que únicamente detecta secuencias conocidas, por lo que no permite la identificación de nuevas variantes. Por ello, podremos utilizarla cuando el número de regiones a estudiar sea pequeño y, por ejemplo, para conocer el estado de alteraciones con interés en la CHIP, como los hotspots de las mutaciones más frecuentes. Algunos ejemplos podrían ser el estudio de la mutación R882H en DNMT3A, V617F en JAK2, K700E en SF3B1 o P95H en SRSF2. Sin embargo, dado que los genes principalmente mutados en la CHIP (genes DTA) se caracterizan por la presencia de mutaciones de tipo indel que generalmente afectan a toda la región codificante del gen, esta técnica no será de gran utilidad para su estudio. En cambio, debido a su alta sensibilidad, especificidad, y al tratarse de una técnica coste-efectiva, la qPCR supondrá una muy buena opción para la monitorización de una mutación ya conocida.

Tabla 2. Comparación de las principales características de las técnicas moleculares utilizadas en el ámbito asistencial.

Técnica Cantidad/calidad ADN de partida Sensibilidad (límite detección) Tiempo de respuesta Coste económico
NGS dirigida 50-200 ng 2-5% Moderado (2-4 semanas) Moderado
Secuenciación Sanger 40-80 ng 15-20% Bajo (4-5 días) Bajo
WES 200-1000 ng Calidad elevada 2-15% Alto (1,5-2 meses) Elevado
qPCR 1-100 ng 1-5% Bajo (< 24 h) Bajo

Metodologías en el ámbito de investigación

Existen otras técnicas, restringidas actualmente al ámbito de la investigación, que permiten la detección de mutaciones y/o CNVs y por tanto podrían servir para la identificación de individuos con CHIP. Algunas de ellas (las más extendidas) se resumen a continuación.

En primer lugar, la PCR digital (dPCR) es una técnica robusta que permite la detección y cuantificación absoluta de moléculas de ADN/cADN y que se caracteriza por su gran sensibilidad, pudiendo llegar al 0,001%. Se basa principalmente en realizar un gran número de particiones de la muestra de partida (que estará muy diluida), de forma que ésta esté dividida en moléculas individuales, y llevar a cabo una reacción de PCR en cada una de las particiones. Existen principalmente dos métodos de dPCR, en función del método para llevar a cabo la partición de la muestra de partida: la droplet digital PCR (ddPCR) y la dPCR basada en el uso de chips microfluídicos.43 En general, la ddPCR permite trabajar con mayor rango de concentración de muestra y permite conseguir un mayor número de particiones, por lo que suele proporcionar una mayor sensibilidad. Al igual que la qPCR, la dPCR únicamente detecta secuencias conocidas, por el contrario, permite una cuantificación absoluta que no requiere de estándares de calibración, por lo que el proceso suele ser más preciso y reproducible. Además, la sensibilidad es superior.43

La secuenciación masiva del genoma completo (WGS, de whole genome sequencing), como indica su nombre, está enfocada a secuenciar todo un genoma a partir de una muestra de ADN. La principal ventaja de esta técnica es que permite obtener una gran cantidad y variabilidad de datos. Podremos detectar la presencia de mutaciones puntuales e indels, pero además esta técnica también nos permitirá detectar la presencia de CNVs (ganancias y pérdidas), la presencia de regiones de homocigosidad sin cambio en el número de copias y la presencia de fusiones y reordenamientos.40 Es una técnica ideal para el descubrimiento de nuevas alteraciones en el campo del cáncer y en otros ámbitos, ya que no es necesario un conocimiento previo de las regiones a estudiar,30 pero va acompañada de una serie de inconvenientes que hacen que su uso en el ámbito asistencial sea muy difícil: el elevado coste, (secuenciación y almacenamiento de datos), la falta de estandarización en el análisis de datos (especialmente para CNVs y reordenamientos) y la interpretación de resultados, y la sensibilidad (la profundidad a la que se suele secuenciar un genoma completo es baja, 30x, debido a su elevado coste, por lo que será muy difícil detectar alteraciones con VAF <10%).41

Finalmente, las técnicas de secuenciación del ARN (RNA sequencing, RNAseq) se basan en la secuenciación de moléculas de ADN complementario (cADN) y no de ADN genómico, y por tanto nos aportan información directa sobre el ARN. De forma general, el RNAseq nos permite obtener información sobre: la secuencia del ARN (detección de variantes), los transcritos resultantes del proceso de splicing alternativo, la modificación postranscripcional, las fusiones génicas, y los cambios de expresión génica. Las principales limitaciones del RNAseq residen en la muestra de partida (requiere ARN de buena calidad y éste se degrada con mayor facilidad que el ADN, por lo que será más difícil obtener un material óptimo) y en el análisis. Este puede resultar muy complejo y requiere de expertos bioinformáticos, ya que el análisis de ARN para la detección de mutaciones no está tan estandarizado como a partir de ADN. Además, hay que tener en cuenta que, al estar secuenciando cADN, los resultados dependerán siempre de si el gen en cuestión, así como el alelo que contiene la variante, se expresan y no sufren degradación mediante el mecanismo de nonsense-mediated mRNA decay.

Interpretación de variantes

Una vez llevado a cabo el estudio molecular en una muestra con el objetivo de evaluar la presencia de CHIP, ya sea por NGS o mediante otra tecnología, será necesario interpretar los resultados de las variantes obtenidas. Vale la pena mencionar que, si el estudio molecular de la CHIP se lleva a cabo mediante NGS de un panel de genes, en la Guía de aplicación clínica de la secuenciación masiva en SMD y LMMC (GESMD, 2017) se describe con detalle el proceso de análisis de datos de NGS.

Para llevar a cabo una correcta interpretación de los resultados, primero necesitaremos obtener toda la información disponible sobre la/s variante/s a interpretar (anotar la variante), para lo que podemos utilizar numerosos recursos disponibles online, principalmente bases de datos clínicas y algoritmos de predicción, descritos con mayor detalle a continuación. En segundo lugar, y a partir de la información recogida, utilizaremos un algoritmo que nos permita clasificar/categorizar dicha variante, para establecer su patogenicidad y así poder llevar a cabo una correcta interpretación en el contexto clínico. La mayoría de algoritmos de categorización permiten clasificar las variantes en función de si son patogénicas, probablemente patogénicas, de significado incierto, probablemente benignas o benignas.

Es importante remarcar que, tanto en los estudios publicados hoy en día en el ámbito de la CHIP como en la definición propuesta por Steensma y colaboradores, la presencia de cualquier alteración adquirida (somática) en sangre en un gen relacionado con neoplasia hematológica, se considera suficiente para establecer la clonalidad que da nombre al fenómeno de CHIP. 13 Es decir, en ninguno de estos trabajos se indica que la variante detectada tenga que ser necesariamente patogénica. Como pasa con las variantes detectadas en las neoplasias hematológicas, lo más probable es que el impacto de las distintas clases de variantes no sea el mismo, y por tanto tampoco su relevancia a nivel clínico. Sin embargo, todavía falta evidencia y se necesitan estudios que evalúen el impacto de la patogenicidad de la variante para poder realizar una recomendación. Por ello, desde el GESMD se recomienda categorizar las variantes de acuerdo con los algoritmos propuestos en esta guía y recoger esta información para poder evaluarla con el tiempo.

Bases de datos

• Bases de datos clínicas

Existen multitud de bases de datos que aportan distinta información sobre las variantes genéticas. En este apartado se recoge una serie de bases de datos disponibles a las que podemos recurrir, clasificadas por el tipo de información que aportan (Tabla 3), y se resumen aquellas más relevantes para la categorización de variantes somáticas.

• Bases de datos de secuencias de referencia

En las bases de datos de secuencias de referencia podemos encontrar, visualizar y descargar las secuencias de los genomas de referencia completos de distintos organismos, así como una gran variedad de información relacionada: secuencia genómica, número y secuencia de intrones y exones, transcritos, secuencia proteica, etc. Estas bases se van actualizando a medida que nuevos genomas se van completando y, para los genomas existentes, contienen la información de las distintas versiones que se han ido publicando.

Algunas de estas bases de datos, como el National Center for Biotechnology Information (NCBI), combinan una gran variedad de fuentes primarias de datos: alberga un conjunto de bases de datos de secuencia, taxonomía, genomas o mutaciones, entre otras, y además herramientas como BLAST para búsquedas por similitud de secuencia.

• Bases de datos poblacionales

Estas bases de datos nos facilitan la información de la frecuencia de la variante en la población general; algunas de las bases de datos incluyen también la frecuencia de distintos grupos poblacionales.

Genome AggregationDatabase (gnomAD): es un proyecto que trata de unir y homogenizar datos de exomas y genomas procedentes de una gran cantidad de proyectos de investigación, y hacer accesible dicha información a la comunidad científica. En su primera versión contenía solo datos de exomas y se denominó Exome Aggregation Consortium (ExAC). La nueva versión denominada gnomAD, recoge información de la secuenciación de 125.748 exomas y 15.708 genomas de individuos no relacionados en estudios de enfermedad o genética de poblaciones; en total se incluyen 141.456 individuos alineados contra el genoma de referencia GRCh37. En esta base de datos no se incluyen casos pediátricos con patología severa ni sus familiares de primer grado.

dbSNP Short Genetic Variation: la base de datos dbSNP contiene el registro de variantes humanas frecuentes o con implicaciones clínicas de un único nucleótido, microsatélites y pequeñas inserciones y deleciones acompañadas de publicaciones científicas, la frecuencia poblacional, consecuencia molecular y genómica. Estas variantes tienen un código de referencia rs (Reference SNP o RefSNP) de acceso estable en las distintas construcciones del genoma y que facilita los estudios de asociación genómicos, ya que proporciona una anotación estable tanto para variantes polimórficas como patogénicas.

• Bases de datos de patogenicidad: variantes somáticas y germinales
Este grupo de bases de datos recoge información sobre la asociación o causalidad entre la presencia de una variante y un fenotipo concreto. A grandes rasgos tenemos dos tipos de variantes: las de origen germinal asociadas a patología constitucional o predisposición a ciertas enfermedades y las de origen somático, adquiridas, presentes en patología tumoral.

Tabla 3. Bases de datos utilizadas para la categorización de variantes genéticas

Bases de datos de secuencias de referencia
Ensembl genome browser http://www.ensembl.org/index.html
UCSC genome browser https://genome.ucsc.edu/cgi-bin/hgTables
NCBI Reference Sequence Database https://www.ncbi.nlm.nih.gov/genome
RefSeqGene https://www.ncbi.nlm.nih.gov/refseq
Locus Reference Genomic https://www.lrg-sequence.org
Base de datos poblacionales
Genome AggregationDatabase (gnomAD) http://gnomad.broadinstitute.org/
dbSNP Short Genetic Variation https://www.ncbi.nlm.nih.gov/snp/
NHLBI Exome Sequencing Project (ESP) Exome Variant Server http://evs.gs.washington.edu/EVS/
1,000 Genomes Project http://phase3browser.1000genomes.org/index.html
dbVar https://www.ncbi.nlm.nih.gov/dbvar
Bases de datos de variantes somáticas y germinales
Catalogue Of Somatic Mutations In Cancer (COSMIC) http://cancer.sanger.ac.uk/cosmic
ClinVar http://www.ncbi.nlm.nih.gov/clinvar
Human Gene Mutation Database (HGMD) http://www.hgmd.cf.ac.uk/ac/index.php
Leiden Open Variation Database (LOVD) http://www.lovd.nl
Intogen https://www.intogen.org/search
Bases de datos de genes asociados a patología
Online Mendelian Inheritance in Man (OMIM) https://www.omim.org/
Bases de datos de Terapias & Ensayos Clínicos
REEC Registro Español de Ensayos Clínicos https://reec.aemps.es/reec/public/web.html
EU Clinical Trials Register https://www.clinicaltrialsregister.eu/
Clinical Trials.gov https://clinicaltrials.gov/ct2/
Personalized cancer therapy, MD Anderson Cancer Center https://pct.mdanderson.org
Bases de datos de variantes de proyectos
NIH National Cancer Institute’s Genome Data Commons https://gdc.cancer.gov
The Cancer Genome Atlas (TCGA) https://cancergenome.nih.gov/
cBioPortal, Memorial Sloan Kettering Cancer Center http://www.cbioportal.org
International Cancer Genome Consortium (ICGC) https://dcc.icgc.org
Bases de datos de variantes específicas de gen
IARC TP53 mutation database (WHO) http://p53.iarc.fr/TP53GeneVariations.aspx
The TP53 WEB site http://p53.fr/
Seshat somatic and germline TP53 variants http://vps338341.ovh.net/
Bases de datos internas
RESMDmol https://www.gesmd.es/carrerasresearch/index.php
Propia del LABORATORIO

Catalogue Of Somatic Mutations In Cancer (COSMIC): es una base de datos pública que recopila información sobre las mutaciones somáticas descritas en cáncer. En esta base una misma variante puede tener diferentes códigos COSMIC asociados a diferentes transcritos; o a información que no ha sido debidamente revisada. Para la categorización tendremos en cuenta en primer lugar que la variante haya sido descrita recurrentemente en tumores hematológicos, y en segundo que esté presente en tumores sólidos.

ClinVar: es una base de datos pública que recoge información entre la relación de variaciones genéticas humanas y sus fenotipos, apoyada por evidencia. Los alelos descritos son alineados a las secuencias de referencia y publicados de acuerdo a la nomenclatura estándar de la Human Genome Variation Society (HGVS). El nivel de confianza en el valor de la variante y sus implicaciones clínicas depende en gran parte del valor de la evidencia aportada, por lo que es importante tener en cuenta la fecha de publicación, la fuente y el método utilizado. Esta base de datos históricamente ha recogido variantes germinales, pero desde hace unos años incluye también variantes de origen somático.

Otros tipos de bases de datos

Tal y como se recoge en la Tabla 3, existen muchos otros tipos de bases de datos que pueden consultarse y que pueden ser de utilidad durante el proceso de interpretación de variantes. Entre ellas tenemos las bases de datos de genes asociados a patología, como la de datos de enfermedades mendelianas OMIM, o las bases de datos de terapias y ensayos clínicos, cuyo objetivo es servir de fuente de información en materia de estudios clínicos. Por otro lado, las bases de datos de variantes de proyectos nacen de grandes proyectos de secuenciación que se han llevado a cabo en los últimos años a nivel internacional y que han generado, a partir de los resultados extraídos, recursos online y bases de datos que ponen a disposición de la comunidad y que se pueden consultar de forma gratuita. En cuanto a las bases de datos de variantes específicas de gen, se encuentran por ejemplo las tres principales bases sobre el gen TP53, el más frecuentemente mutado en cáncer, así como información sobre todas aquellas variantes que se han identificado en este gen.

Finalmente, se recomienda que aquellos laboratorios que trabajen con datos moleculares, y especialmente con datos de secuenciación de NGS, creen sus propias bases de datos internas. Estas bases pueden ser útiles para la detección de variantes recurrentes en los pacientes estudiados, así como para identificar artefactos o errores (de secuenciación o de análisis) que pueden aparecer de forma recurrente en la metodología empleada en el laboratorio. Así mismo, el GESMD ha creado una base de datos interna que recopila la información molecular generada a partir de datos de NGS por los grupos del GESMD, denominada RESMDmol.

Algoritmos de predicción

Los algoritmos in silico de predicción son herramientas que se utilizan para pronosticar si una alteración en un gen es capaz de afectar la estructura o función de la proteína para la que codifica. Originalmente, la mayoría de estos algoritmos se desarrollaron y validaron para el análisis de variantes germinales. Posteriormente se incorporaron en la interpretación de variantes somáticas, aunque en el contexto de función génica del cáncer la interpretación de las predicciones no es sencilla, especialmente en las mutaciones activadoras. Por ejemplo, la mutación oncogénica activadora V600E en BRAF es considerada neutral por algunos predictores (como MutationAssessor), por lo que se recomienda mucha precaución en la interpretación de los scores de predicción y no utilizarlos nunca como única evidencia para la clasificación de una variante o en la toma de decisiones clínicas.

Existen multitud de algoritmos de predicción in silico para diferentes tipos de alteraciones. En general, estas herramientas de predicción tienen una especificidad moderada (60-80%) con tendencia a sobredimensionar el efecto, y se pueden clasificar en dos grupos: predictores del impacto de una variante de tipo missense y predictores del impacto de una variante de splicing (Tabla 4). Estas herramientas pueden ser especialmente útiles para la categorización de aquellas variantes que no están descritas en las bases de datos clínicas y cuyo impacto se desconoce, ya que pueden sugerir si el efecto sobre la proteína puede ser deletéreo o no, y por tanto de si es más probable que la variante sea o no patogénica.

Algoritmos de categorización de variantes

En la era de la NGS, la categorización sistemática de las variantes somáticas sigue siendo un reto para los laboratorios clínicos, ya que actualmente no está estandarizada. Existe la necesidad de desarrollar nuevas herramientas de interpretación que apoyen la toma de decisiones a partir de la evidencia científica y clínica.

Tabla 5. Criterios de inclusión con evidencia clínica y/o experimental para cada categoría de la AMP/ACMG.44

Cat. Terapia Diagnóstico & Pronóstico
A 1. Biomarcadores que predicen una respuesta o resistencia a terapias aprobadas por la FDA para un tipo de tumor específico.
2. Biomarcadores incluidos en guías profesionales que predicen respuesta o resistencia a terapias para un tipo de tumor específico.
Biomarcadores incluidos en guías profesionales de diagnóstico/pronóstico para un tipo de tumor específico.
B Biomarcadores que predicen una respuesta o resistencia a terapias para un tipo de tumor específico en base a estudios sólidos con consenso entre expertos en el campo. Biomarcadores de significado diagnóstico/pronóstico para un tipo de tumor específico en base a estudios sólidos con consenso entre expertos en el campo.
C 1. Biomarcadores que predicen una respuesta o resistencia a terapias aprobadas por la FDA o sociedades profesionales para un tipo de tumor diferente.
2. Biomarcadores que sirven como criterio de inclusión para ensayos clínicos.
Biomarcadores de significado diagnóstico/pronóstico en base a los resultados de múltiples pequeños estudios.
D Biomarcadores que muestran significado terapéutico plausible en a base a estudios preclínicos. Biomarcadores que pueden ayudar en el diagnóstico/pronóstico de enfermedad por sí mismos o junto con otros biomarcadores en base a pequeños estudios o a unos pocos casos.

Abreviaturas: Cat, categoría; FDA, Food and Drug Administration.

Algoritmo de la AMP/ACMG
En un esfuerzo por unificar criterios de interpretación e informes de resultados moleculares, un grupo multidisciplinar (AMP con representación de la ACMG, ASCO y CAP) estableció en 2017 una serie de recomendaciones para clasificar, anotar, interpretar e informar variantes somáticas. Así, este grupo propone que la interpretación de las variantes (biomarcadores) debe realizarse en base a su impacto clínico, incluyendo las implicaciones terapéuticas, pronósticas, diagnósticas y preventivas.44 Se consideran biomarcadores aquellas variantes que afectan al cuidado clínico del paciente. La evidencia empleada para la categorización de una variante puede tener mayor o menor peso en base a su significado a la hora de tomar decisiones clínicas. Este grupo establece 4 clases (tiers) según la evidencia experimental y clínica (niveles A, B, C y D).

Estos niveles de evidencia pueden asignarse a las variantes genómicas para determinar el significado de su impacto clínico. Este grupo propone categorizar las variantes de línea somática en 4 clases (I, II, III, IV) en base a su significado clínico (Figura 2).

Los profesionales de diagnóstico molecular también recurren a otro tipo de recursos, como pueden ser el tipo de mutación o las predicciones in silico, como apoyo para la clasificación efectiva de una variante particular. Es importante contemplar además la información obtenida a partir de estas fuentes, siendo ésta tratada con atención y juzgada por cada profesional para la categorización basada en evidencia de las variantes encontradas.

Algoritmo del GESMD

En la Guía de aplicación clínica de la secuenciación masiva en SMD y LMMC se propone un sistema de categorización de variantes muy parecido al de la AMP/ACMG, donde se establecen 5 clases funcionales. Esta categorización fue actualizada y publicada en 2020.45 De acuerdo con este sistema, las variantes se categorizan en patogénica, probablemente patogénica, de significado incierto, probablemente benigna, y benigna, en base a los siguientes criterios:

  • Presencia recurrente en bases de datos o en la literatura, que indiquen la patogenicidad o la recurrencia de la variante identificada.
  • Tejido y/o histología del tumor en la que se ha descrito la variante.
  • Relación causal o accionabilidad del gen afectado por la variante identificada en la patología a estudio.
  • Algoritmos de predicción y estudios funcionales.
Tier I
Variantes relevantes en la clínica
En diagnóstico, pronóstico o tratamiento.
Tier II
Variantes potencialmente relevantes en la clínica.
En diagnóstico, pronóstico o tratamiento.
Tier III
Variantes con relevancia incierta en la clínica.
Tier IV
Variantes benignas o probablmente benignas.
Grado de evidencia A
Tratamiento dirigido aprobado por la FDA.
Incluido en Guías Clínicas.
Grado de evidencia C
Tratamiento dirigido aprobado por la FDA para otro tipo de tumores o en investigación clínica.
No ha sido descrita en frecuencia significativa en las poblaciones de datos de población sana o en resgistros de variantes en cáncer. Descrita en frecuencia significativa en las bases de datos de población sana.
Grado de evidencia B
Estudios con suficiente potencia estadística on consenso entre los expertos en el campo.
Grado de evidencia D
Estudios preclínicos o casos comunicados sin consenso.
No existe evidencia científica publicada convincente de su asociación con cáncer. No existe evidencia científica publicada convincente de su asociación con cáncer.

Figura 2. Categorización de variantes en base a la evidencia clínica según los criterios AMP/ACMG. Las variantes somáticas se clasifican en 4 clases (tiers). Las variantes de clase I son las de significado clínico más sólido, las de clase II son de posible significado clínico, las de clase III son las variantes de significado incierto y las variantes de clase IV son benignas o probablemente benignas. FDA: Food and Drug Administration. Modificado de Li, et al.44

Páginas web o programas de recopilación de información

Por último, se describe una serie de páginas web o programas que, sin ser bases de datos propiamente dichas, recopilan gran cantidad de información de muchas de las bases de datos y algoritmos anteriores (Tabla 6). En definitiva, facilitan y agilizan mucho la búsqueda de información sobre una variante.

VarSome, The Human Genomic Variant Search Engine: una de las herramientas más utilizadas es la versión libre de VarSome que, además de aportar una clasificación para las variantes, proporciona información adicional y enlaces a páginas que recogen información de interés, como pueden ser referencias bibliográficas relacionadas, bases de datos poblacionales y mutacionales, algoritmos de predicción, categorización de acuerdo con el algoritmo AMP/ACMG,46 etc. VarSome contempla una versión de pago (VarSome Clinical) para el análisis completo de datos de NGS. Presenta dos espacios diferenciados de análisis para la categorización de variantes germinales y somáticas.

Tabla 6. Lista de web o programas de recopilación de información.

Nombre. Dirección WEB Tipo
My Cancer Genome http://www.mycancergenome.org WEB de acceso libre
VarSome https://varsome.com/ WEB de acceso libre (parte de la información mediante pago)
Franklin Genoox https://franklin.genoox.com/clinical-db/home
Genetic Variant Interpretation Tool http://www.medschool.umaryland.edu/Genetic_Variant_Interpretation_Tool1.html/
InterVar http://wintervar.wglab.org/
VIC https://github.com/HGLab/VIC/
Variant Interpreter https://variantinterpreter.informatics.illumina.com/home
Sophia DDM Software corporativo de SOPHiA Genetics de pago
Cartagenia Software corporativo de Agilent Technologies de pago
Alamut https://www.interactive-biosoftware.com/ Software corporativo de Interactivebiosoftware de pago

Franklin Genoox: otro programa online de interés, también basado en la guía de interpretación de variantes de la AMP/ACMG de 2015.46 Se trata de una herramienta similar a la de VarSome, con la posibilidad de subir archivos vcf de forma gratuita actualmente. Una de las ventajas que ofrece este programa es que incluye un apartado con información sobre evidencia clínica de las variantes somáticas.

InterVar: herramienta informática que se desarrolló para la interpretación del significado clínico de variantes germinales y utiliza 28 criterios recomendados por la guía AMP/ACMG de 2015,46 18 de los cuales se generan de manera automática mientras que los otros 10 se ajustan de forma manual.

VIC, Variant Interpretation for Cancer: utilizando procedimientos similares a InterVar, se desarrolló esta herramienta para la interpretación de variantes somáticas en cáncer en base a la guía AMP/ASCO/CAP de 2017 y clasifica las variantes en 4 categorías: (1) marcado significado clínico, (2) potencial significado clínico, (3) significado clínico desconocido, y (4) benigna o probablemente benigna.47

Referencias


1. Genovese G, et al. Clonal hematopoiesis and blood-cancer risk inferred from blood DNA sequence. N Engl J Med. 2014 Dec 25;371(26):2477-87.


2. Jaiswal S, et al. Age-related clonal hematopoiesis associated with adverse outcomes. N Engl J Med. 2014 Dec 25;371(26):2488-98.


3. Xie M, et al. Age-related mutations associated with clonal hematopoietic expansion and malignancies. Nat Med. 2014 Dec;20(12):1472-8.


4. Zink F, et al. Clonal hematopoiesis, with and without candidate driver mutations, is common in the elderly. Blood. 2017 Aug 10;130(6):742-752.


5. Coombs CC, et al. Therapy-Related Clonal Hematopoiesis in Patients with Non-hematologic Cancers Is Common and Associated with Adverse Clinical Outcomes. Cell Stem Cell. 2017 Sep 7;21(3):374-382.e4.


6. Bolton KL, et al. Managing Clonal Hematopoiesis in Patients With Solid Tumors. J Clin Oncol. 2019 Jan 1;37(1):7-11.


7. Kwok B, et al. MDS-associated somatic mutations and clonal hematopoiesis are common in idiopathic cytopenias of undetermined significance. Blood. 2015 Nov 19;126(21):2355-61.


8. Malcovati L, et al. Clinical significance of somatic mutation in unexplained blood cytopenia. Blood. 2017 Jun 22;129(25):3371-3378.


9. Babushok DV, et al. Somatic Mutations and Clonal Hematopoiesis in Aplastic Anemia. N Engl J Med. 2015 Oct 22;373(17):1673.


10. Yoshizato T, et al. Somatic Mutations and Clonal Hematopoiesis in Aplastic Anemia. N Engl J Med. 2015 Jul 2;373(1):35-47.


11. Young AL, et al. Clonal haematopoiesis harbouring AML-associated mutations is ubiquitous in healthy adults. Nat Commun. 2016 Aug 22;7:12484.


12. Acuna-Hidalgo R, et al. Ultra-sensitive Sequencing Identifies High Prevalence of Clonal Hematopoiesis-Associated Mutations throughout Adult Life. Am J Hum Genet. 2017 Jul 6;101(1):50-64.


13. Steensma DP, et al. Clonal hematopoiesis of indeterminate potential and its distinction from myelodysplastic syndromes. Blood. 2015 Jul 2;126(1):9-16.


14. Challen GA, et al. Dnmt3a is essential for hematopoietic stem cell differentiation. Nat Genet. 2011 Dec 4;44(1):23-31


15. Jeong M, et al. Large conserved domains of low DNA methylation maintained by Dnmt3a. Nat Genet. 2014 Jan;46(1):17-23.


16. Challen GA, Goodell MA. Clonal hematopoiesis: mechanisms driving dominance of stem cell clones. Blood. 2020 Oct 1;136(14):1590-1598.


17. Watson CJ, et al. The evolutionary dynamics and fitness landscape of clonal hematopoiesis. Science. 2020 Mar 27;367(6485):1449-1454.


18. Koh KP, et al. Tet1 and Tet2 regulate 5-hydroxymethylcytosine production and cell lineage specification in mouse embryonic stem cells. Cell Stem Cell. 2011 Feb 4;8(2):200-13.


19. Moran-Crusio K, et al. Tet2 loss leads to increased hematopoietic stem cell self-renewal and myeloid transformation. Cancer Cell. 2011 Jul 12;20(1):11-24.


20. Jaiswal S, Ebert BL. Clonal hematopoiesis in human aging and disease. Science. 2019 Nov 1;366(6465):eaan4673.


21. Bondar T, Medzhitov R. p53-mediated hematopoietic stem and progenitor cell competition. Cell Stem Cell. 2010 Apr 2;6(4):309-22.


22. Wong TN, et al. Rapid expansion of preexisting nonleukemic hematopoietic clones frequently follows induction therapy for de novo AML. Blood. 2016 Feb 18;127(7):893-7.


23. Akbari MR, et al. PPM1D mutations in circulating white blood cells and the risk for ovarian cancer. J Natl Cancer Inst. 2014 Jan;106(1):djt323.


24. Hsu JI, et al. PPM1D Mutations Drive Clonal Hematopoiesis in Response to Cytotoxic Chemotherapy. Cell Stem Cell. 2018 Nov 1;23(5):700-713.e6.


25. Kahn JD, et al. PPM1D-truncating mutations confer resistance to chemotherapy and sensitivity to PPM1D inhibition in hematopoietic cells. Blood. 2018 Sep 13;132(11):1095-1105.


26. Wong TN, et al. Role of TP53 mutations in the origin and evolution of therapy-related acute myeloid leukaemia. Nature. 2015 Feb 26;518(7540):552-555.


27. Gillis NK, et al. Clonal haemopoiesis and therapy-related myeloid malignancies in elderly patients: a proof-of-concept, case-control study. Lancet Oncol. 2017 Jan;18(1):112-121.


28. Takahashi K, et al. Preleukaemic clonal haemopoiesis and risk of therapy-related myeloid neoplasms: a case-control study. Lancet Oncol. 2017 Jan;18(1):100-111.


29. Jaiswal S, et al. Clonal Hematopoiesis and Risk of Atherosclerotic Cardiovascular Disease. N Engl J Med. 2017 Jul 13;377(2):111-121.


30. Metzker ML. Sequencing technologies – the next generation. Nat Rev Genet. 2010 Jan;11(1):31-46.


31. Goodwin S, McPherson JD, McCombie WR. Coming of age: ten years of next-generation sequencing technologies. Nat Rev Genet 2016 17(6):333.


32. Mamanova L, et al. Target-enrichment strategies for next-generation sequencing. Nat Methods. 2010 Feb;7(2):111-8.


33. Gulilat M, et al. Targeted next generation sequencing as a tool for precision medicine. BMC Med Genomics. 2019 Jun 3;12(1):81.


34. Bastida JM, et al. Molecular Diagnosis of Inherited Coagulation and Bleeding Disorders. Semin Thromb Hemost. 2019 Oct;45(7):695-707.


35. Bewicke-Copley F, Arjun Kumar E, Palladino G, Korfi K, Wang J. Applications and analysis of targeted genomic sequencing i cancer studies. Comput Struct Biotechnol J. 2019 Nov 7;17:1348-1359.


36. Myllykangas et al. Targeted deep resequencing of the human cancer genome using next-generation technologies. Biotechnol Genet Eng Rev. 2010; 27:135–158.


37. Klee EW, Hoppman-Chaney NL and Ferber MJ. Expanding DNA diagnostic panel testing: is more better? Expert Rev. Mol. Diagn. 2011;11(7), 703-9.


38. Shendure J, Hanlee J. Next-generation DNA sequencing. Nat Biotech. 2008; 26:1135–45.


39. Rennert H, et al. Development and validation of a whole-exome sequencing test for simultaneous detection of point mutations, indels and copy-number alterations for precision cancer care. NPJ Genom Med. 2016;1:16019.


40. Pareek CS, Smoczynski R, Tretyn A. Sequencing technologies and genome sequencing. J Appl Genet. 2011 Nov;52(4):413-35.


41. Sims D, Sudbery I, Ilott NE, Heger A, Ponting CP. Sequencing depth and coverage: key considerations in genomic analyses. Nat Rev Genet. 2014 Feb;15(2):121-32.


42. Mauricio J. Molecular Biology in Clinical Diagnosis. Rev Med Clin Las Condes. 2015;26(6);788-93.


43. Kanagal-Shamanna R. Digital PCR: Principles and Applications. Methods Mol Biol. 2016; 1392:43-50.


44. Li MM, et al. Standards and Guidelines for the Interpretation and Reporting of Sequence Variants in Cancer: A Joint Consensus Recommendation of the Association for Molecular Pathology, American Society of Clinical Oncology, and College of American Pathologists. J Mol Diagn. 2017 Jan;19(1):4-23.


45. Grupo Español de Síndromes Mielodisplásicos (GESMD). Guía de aplicación clínica de la secuenciación masiva en síndromes mielodisplásicos y leucemia mielomonocítica crónica. Palomo L, et al Spanish Guidelines for the use of targeted deep sequencing in myelodysplastic syndromes and chronic myelomonocytic leukaemia. Br J Haematol. 2020 Mar;188(5):605-622.


46. Richards S, et al. Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology. Genet Med. 2015 May;17(5):405-24.


47. He MM et al. Variant Interpretation for Cancer (VIC): a computational tool for assessing clinical impacts of somatic variants. Genome Med 2019 Aug 23;11(1):53.