En los laboratorios de investigación es muy frecuente trabajar con proteínas recombinantes expresadas en sistemas heterólogos como bacterias, levaduras o células de mamífero, entre otros.
Uno de los factores sobre los que se puede incidir para mejorar el rendimiento en la obtención de estas proteínas, es la optimización de codones. Esta técnica incrementa la eficiencia de traducción del gen diana, mejorando sus niveles de expresión en un determinado organismo.
Según el código genético, existen 64 combinaciones de tripletes posibles (combinaciones de 3 nucleótidos) que codifican para una veintena de aminoácidos, ya que un mismo aminoácido puede estar representado por múltiples tRNAs.
Los diferentes organismos favorecen la abundancia de determinadas especies de tRNAs. Si un gen contiene codones que raramente se usan por el host en el que se pretende expresar la proteína de interés, el nivel de expresión de la misma nunca será máximo.
Por eso resulta imprescindible conocer las especies de tRNAs predominantes en el organismo (E. coli, Pichia, etc.) en el que se llevará a cabo la expresión recombinante de nuestra proteína, para poder así adaptar la secuencia genética a los mismos, lo que se conoce como optimización de codones.
Por todo ello, el primer paso en el diseño de la secuencia genética que se insertará en el host para la expresión de una determinada proteína ha de ser la optimización de codones, en base al uso de los mismos por el organismo en cuestión.
Para llevar a cabo la optimización de codones correctamente, hay que estudiar los determinados parámetros. A continuación describimos algunos de los más relevantes:
Se trata de un índice especie-específico que mide el grado en el que se adaptan los codones de una determinada secuencia genética a las frecuencias de uso de codones de un determinado organismo.
Este parámetro predice la eficiencia de la traducción, o en otras palabras, el nivel de expresión de la proteína. Cuanto más cercano a 1 sea este valor, mejor será dicho nivel de expresión.
Los codones preferentes serán aquellos que puedan parearse de manera óptima con el tRNA más abundante.
Es importante optimizar las cajas TATA e incluir siempre la señal de terminación en el cDNA para maximizar el rendimiento de la expresión heteróloga de proteínas.
Conviene sustituir los codones de enzimas de restricción presentes en la secuencia genética de interés por codones sinónimos para eliminar los sitios de corte de estas enzimas.
La optimización de codones es una tarea compleja pero imprescindible para optimizar y maximizar el nivel de expresión de una determinada proteína en un sistema heterólogo.