Desde su aparición hace algo más de una década, hemos sido testigos de cómo la tecnología RNA-Seq ha revolucionado nuestro conocimiento del transcriptoma. Esta metodología lleva a cabo una estimación de la expresión génica en base al número de fragmentos de ARN procedentes de la secuenciación que alinean con una determinada región de un genoma o transcriptoma de referencia.
Los análisis de expresión diferencial comparan la actividad transcripcional entre varias condiciones de interés con el fin de identificar qué genes son los responsables de las diferencias entre estas. Hay que tener presente que en este tipo de experimentos existe un ruido inherente a la propia metodología RNA-Seq resultado de la combinación de la variabilidad biológica y de la generada durante el procesamiento de las muestras y la secuenciación. Se requiere, por lo tanto, un diseño experimental apropiado para contrarrestar este inconveniente y garantizar una interpretación acertada de los resultados.
De forma general, con un mayor número de réplicas se obtienen datos estadísticamente más robustos, permitiendo identificar los genes diferencialmente expresados y estimar los niveles de expresión de forma más precisa. Por lo tanto, lo ideal sería partir del mayor número posible de muestras por condición para poder prescindir de aquellas en las que los resultados no sean adecuados. Sin embargo, debido principalmente a limitaciones económicas y de tiempo, no siempre es fácil obtener replicados. Aunque se suele sugerir el uso de 3, este dato no es aplicable a todos los tipos de proyectos.
En resumen, aunque la decisión de cuántas réplicas se van a utilizar depende en última instancia del investigador, ampliar el número siempre conlleva un aumento de la sensibilidad y de la especificidad, y en definitiva de la calidad de los resultados.
BIBLIOGRAFÍA