1 Bioinformática y Linux
1.1 Qué es bioinformática
La bioinformática puede ser entendida como un disciplina que combina técnicas de múltiples campos de conocimiento para interpretar datos biológicos. Campos como la biología, ciencias de la computación, matemáticas y estadística son usados en la bioinformática para analizar datos biológicos, mayoritariamente secuencias de ADN o proteínas, y extraer conocimiento de ellos.
Aunque la bioinformática ha estado presente durante los últimos 60 años, se desarrolló fuertemente durante los años 80, y debido a los grandes avances tecnológicos en computación y secuenciación de ADN, la bioinformática ha tenido un creciente auge y demanda durante los últimos 15 años aproximadamente. Actualmente las nuevas tecnologías de secuenciación producen grandes volúmenes de datos, los cuales solo pueden ser analizados eficientemente a través de los computadores, aplicando técnicas de los campos del conocimiento mencionados.
Las ciencias ómicas, como la genómica (estudio de los genomas), la transcriptómica (estudio de los transcriptomas), y la proteómica (estudio de las proteínas), han tenido un gran avance gracias a la bioinformática. Las ómicas han aportado entendimiento de los procesos biológicos involucrados en áreas de interés científico, como enfermedades, medicina personalizada, o mejoramiento de cultivos.
1.2 Qué es Linux
Se puede definir Linux como una familia de sistemas operativos (SOs) de distribución libre y código abierto (open-source1) basados en el núcleo o kernel del mismo nombre. Linux, es tal vez el SO open-source más conocido y usado actualmente en mundo. Linux es usado en diversos dispositivos y para variadas aplicaciones, desde teléfonos celulares, automóviles, refrigeradores, televisores, hasta computadores de escritorio, la mayoría de los servidores que soportan la Internet, y los 500 más poderosos supercomputadores del mundo2.
Dada su fiabilidad y flexibilidad, Linux ha sido adoptado por la comunidad científica al rededor del mundo. Campos como la física de partículas, la astronomía, y las ciencias biomédicas usan Linux como parte de sus flujos de trabajo de investigación y desarrollo. La bioinformática no es la excepción en cuanto al uso de Linux en ambientes científicos, pues actualmente se desarrolla casi exclusivamente en Linux.
1.3 Por qué usar Linux para Bionformática
- Es estable y rápido, apto tanto para computadores de escritorio y portátiles, como para servidores y ambientes distribuidos.
- Es libre: no cuesta nada y puede ser modificado seg según las necesidades del usuario.
- Es POSIX (del inglés Portable Operating System Interface) lo cual asegura compatibilidad e interoperablidad en diferentes sustemas de cómputo.
- La mayoría de software especializado en bioinformática está disponible en Linux.
- Trae listos múltiples programas para procesar archivos.
- Se ha convertido en el SO estándar de facto para Bioinformática.
- Fácil creación de tuberías o pipelines para análisis. Aquí la salida de un programa es la entrada del siguiente, por lo que se dice que son ensamblados como tuberías.
Wikipedia - Software libre y de código abierto: https://es.wikipedia.org/wiki/Software_libre_y_de_c%C3%B3digo_abierto↩︎
Top 500 - Operating system Family / Linux (estadísticas hasta 2022): https://www.top500.org/statistics/details/osfam/1/↩︎