Articulo Bioinformatica
Articulo Bioinformatica
com
RESUMEN: Se introdujo como distribución general una distribución de Linux llamada Bio-Linux.
Plataforma bioinformática destinada principalmente a biólogos investigadores y bioinformáticos. Al
inicio se dio una breve descripción de la bioinformática como disciplina científica, y luego se
presentaron los motivos que influyeron en la creación y desarrollo del sistema operativo Bio-Linux, así
como una descripción de algunas de sus características más importantes. Se hizo una comparación
con otras distribuciones bioorientadas conocidas en la literatura, pero también con las dos
distribuciones científicas más populares actualmente: Scientific Linux y Fedora Scientific. Hacia el final
se hace una reseña de Bio-Linux desde un punto de vista didáctico. El objetivo del trabajo es
familiarizar a la comunidad profesional en general con el potencial y las posibilidades de Bio-Linux, y
señalar algunos aspectos que podrían ser útiles para el desarrollo de la bioinformática en nuestro
país.
Introducción
La informática, como disciplina, se ha convertido en gran medida en una parte inalienable de la civilización
moderna. Constantemente se introducen nuevas tecnologías y quedan obsoletas casi tan pronto como
aparecen (1). Durante 45 años se han estudiado activamente los principios de acción de sustancias
biológicas en órganos aislados de humanos y animales, con especial énfasis en el estado informativo de
las células. El término "bioinformática" se mencionó por primera vez en 1970. en la obra de Hesper
Hogeveg titulada "Bioinformatica: een werkconcept" (2). Significaba cualquier aplicación de la tecnología
de la información a las necesidades de la biología. Durante los años 80 las investigaciones se centraron
principalmente en la célula como unidad funcional y las llamadas comunicaciones intercelulares. Junto con
la investigación en genética, cuyo objetivo está dedicado al estudio de los mecanismos de la información
hereditaria, la bioinformática ha surgido como una nueva dirección de investigación, y el término mismo
comienza a referirse principalmente a algoritmos para el análisis de secuencias de ADN (3). La
importancia inmediata de la bioinformática para el hombre, la naturaleza y la calidad de vida es grande, ya
que los resultados de la investigación bioinformática contribuyen a mejorar el diagnóstico de
enfermedades, la detección de la predisposición genética a las enfermedades, la definición de la terapia
génica, la detección temprana y el tratamiento de la patogénesis, la identificación de ADN y similares (para
obtener más información, consulte (4) y (5)).
El análisis de las secuencias de ADN mencionadas se realiza a partir de una amplia gama de subcampos
utilizando una gran cantidad de métodos y algoritmos diferentes. Los medios básicos de la bioinformática
son los análisis estadísticos de la distribución de letras en bigramas, trigramas, representación de
codones, entropía, análisis de dependencia y similares. Hasta la fecha se han desarrollado una gran
cantidad de diferentes sistemas de información, bases de datos y otros recursos bioinformáticos para su
análisis. Según (6), los principales problemas biológicos en los que se centra la bioinformática son: los
mecanismos moleculares y celulares, el desarrollo de organismos complejos y la evolución. En este
sentido, los problemas (bio)informáticos apropiados son: ensamblaje de secuencias genómicas, anotación,
alineación de secuencias genómicas, determinación de la estructura de proteínas en 3D, reconstrucción de
relaciones filogenéticas entre especies, cálculos del efecto de drogas o toxinas en el organismo, y
simulaciones de procesos biológicos al examinar el modelo matemático apropiado.
Por otro lado, cualquier análisis bioinformático requiere de una plataforma informática adecuada. Por
tanto, surge la pregunta: ¿qué debería caracterizar a una plataforma informática ideal cuando se trata de
bioinformática? Dicen que “la belleza está en los ojos de quien la mira”, por lo que este caso no debería
ser una excepción. En general, se presta atención a la velocidad, la estabilidad, la seguridad, la
comodidad, la posibilidad de conexión en red, el bajo precio, pero también a la cantidad de programas
modernos para cálculos científicos y procesamiento de datos que se pueden ejecutar en la propia
plataforma. De lo contrario, debido a la creciente aplicación de los llamados secuenciación de nueva
generación (SNP) (ing. secuenciación de nueva generación - NGS) y el deseo de obtener resultados lo
más rápido posible, se ha vuelto prácticamente inviable dejar el análisis genómico exclusivamente en
manos de especialistas
en ese campo. En cambio, los propios investigadores asumen al menos parte del trabajo. Sin embargo, para
tal cosa, se deben cumplir al menos las dos condiciones siguientes:
- Acceso habilitado y trabajo con el software adecuado.
- Los investigadores deben adoptar ciertas habilidades para poder manejar grandes cantidades de
datos de SNP.
Además, las formas habituales de procesar datos se están volviendo obsoletas rápidamente en una era de
rápido desarrollo de nuevas tecnologías de secuenciación, nuevos protocolos de laboratorio, nuevas preguntas
que surgen, nuevas bases de datos de referencia, así como el crecimiento de los volúmenes de datos.
Específicamente, una secuencia del genoma de 1.000 dólares puede requerir un análisis de 100.000 dólares
(7). Además, en biología se ha producido una auténtica explosión de diferentes tipos de datos y formatos de
archivos, y precisamente una de las tareas de los ordenadores y de los sistemas de información es almacenar
esos datos brutos y sin procesar y traducirlos en estructuras combinatorias matemáticas adecuadas que
permitan posteriormente permitirán un procesamiento más o menos eficaz y su interpretación. Por lo tanto, las
características mencionadas no son sólo un deseo caprichoso de los investigadores en el campo de los
llamados de las ciencias de la vida, son cada vez más esenciales para la realización de la propia investigación.
Los sistemas de software libre con código disponible públicamente (ing. Software gratuito y de código abierto -
FOSS) son los más cercanos a cumplir con los requisitos de una plataforma de software ideal. Podemos decir
que los mayores proyectos bioinformáticos en sus inicios encontraron refugio en el software FOSS (8)..Por
ejemplo, según Lincoln Stein, Investigador del Laboratorio Cold Spring Harbor, el lenguaje de programación Perl
fue simplemente un salvavidas para el proyecto de secuenciación del genoma humano, como explicó en su
artículo de 1996. titulado "Cómo Perl salvó el Proyecto Genoma Humano" (9). Otro ejemplo de un gran proyecto
que dependió en gran medida del software FOSS es la secuenciación del virus SARS. En el artículo de Martin
Krzivinski "Sequencing the SARS Virus", publicado en 2003 en el LINUX Journal, se describe todo el
procedimiento de secuenciación, que se realizó en la distribución RedHat Linux, con el uso de MySQL, el servidor
web Apache y el bien- Aplicaciones bioinformáticas conocidas BLAST, Phred, Phrap y Consed (10). Un tercer
ejemplo podría ser el proyecto europeo de software abierto de biología molecular (EMBOSS). El paquete en sí
consta de aproximadamente 300 aplicaciones y admite varias interfaces gráficas y de programación de
aplicaciones (interfaz gráfica de usuario - GUI e interfaz de programación de aplicaciones - API). La popularidad
del software FOSS provocó directamente la formación de la Open Bioinformatics Foundation (OBF), como una
organización sin fines de lucro centrada en respaldar el software bioinformático con código de programación
disponible públicamente. Así, la famosa revista Bioinformatics, fundada en 1985, en julio de 2005 insertó una
instrucción complementaria a los autores en su sitio web: "El software y los datos deben estar disponibles
públicamente para usuarios no comerciales". La disponibilidad debe constar explícitamente en el trabajo. Los
autores también deben asegurarse de que su software esté disponible públicamente durante los dos años
completos desde la publicación del trabajo. Los servicios web no deberían requerir registro. Los datos adicionales
y complementarios sólo pueden ser publicados en Internet por la revista o por el autor en su sitio web personal."
Por cierto, cuando se trata de software libre, Linux (11) ciertamente ocupa el lugar central. Por su velocidad,
estabilidad, seguridad, precio (es prácticamente gratis) y gran cantidad de distribuciones, según (12) Linux se ha
convertido en la plataforma que se utiliza en mayor número de máquinas con hardware muy diverso: teléfonos
móviles, tabletas,
supercomputadoras, servidores de red y similares. Para los bioinformáticos, los sistemas operativos Linux son
importantes por la sencilla razón de que la mayor parte del software bioinformático de alta calidad se desarrolló
específicamente para sistemas POSIX. Además, bajo el shell BASH de Linux, abrir archivos SAM/FASTQ, que
pueden ocupar hasta 4 GiB cada uno, y por ejemplo crear uno nuevo compuesto únicamente por lecturas del
Cromosoma 1, se puede hacer con una sola declaración grep, lo cual es casi impensable hacer bajo Windows.
Esto ha llevado al desarrollo de diversas distribuciones que están principalmente orientadas a la bioinformática (8)
(13) (14) (15). Uno de ellos es Bio-Linux, cuyo desarrollo comenzó en el Reino Unido allá por 2002. en el Centro
de Bioinformática y Medio Ambiente NERC (NEBC) (11). Por cierto, el uso frecuente de los términos "Bio" y
"Linux" en los nombres dio origen al término general biolinux(ing.biolinux), que designa todos los proyectos
destinados a facilitar el acceso al software bioinformático en Linux (11). En este artículo, además de las pocas
palabras mencionadas anteriormente sobre bioinformática, se presentará el sistema operativo Bio-Linux, las
razones por las que fue creado, cuáles son los objetivos de todo el proyecto, qué lo distingue de otros sistemas
operativos del Familia Linux y cuál es su papel como material didáctico en la educación bioinformática moderna.
Ya desde el principio Bio-Linux fue clasificado como software libre con código disponible
base de
públicamenteLalicencia. bajo la cual se distribuye es la Licencia BSD Simplificada (16). Ubuntu
proporciona velocidad, estabilidad, capacidad de conexión en red y una amenaza reducida de software malicioso.
En cuanto a las actualizaciones, la popularidad de Ubuntu (16) le otorga seguridad también en ese campo, lo que
es, a grandes rasgos, una especie de promesa de futuro. La última versión, Bio-Linux 8.0, se basa en Ubuntu
12.04, que pertenece a las llamadas versiones. soporte a largo plazo (soporte a largo plazo - LST). Por cierto, la
uniformidad es una de las características más importantes para una cooperación exitosa en investigación
científica, porque permite un intercambio más fácil de datos, promueve la difusión de mejores prácticas y facilita la
provisión de apoyo centralizado y económico. Cuando se trata de Bio-Linux, el soporte técnico se brinda a través
de un mostrador electrónico y talleres organizados por el NERC Environmental "Omics Synthesis Center
(anteriormente NEBC). Una gran cantidad de usuarios, con intereses muy diversos, representa un recurso
invaluable para el desarrollo de cualquier software, y por ende para Bio-Linux. Los programadores pueden
cambiar mediante programación las características del propio sistema operativo e integrarlo con nuevos
componentes y software. Los complementos para la distribución Ubuntu se pueden instalar en Bio-Linux sin
modificaciones especiales. Además, el proyecto incluye la formación de repositorios de software en lugar de
sistemas completos, ya que la comunidad Linux ha simplificado enormemente la distribución de software
mediante "paquetes", con lo que el propio usuario se ahorra su instalación. El desarrollo de programas y su
ubicación en repositorios permite que estén disponibles para todos los usuarios, lo que en última instancia
conduce a una mejora continua a través del uso y la crítica. En el paquete, junto con Bio-Linux, hay más de 500
programas bioinformáticos diferentes (17), lo que prácticamente lo convierte en una única plataforma
bioinformática.
En cuanto a las actualizaciones, como la mayoría de las distribuciones, Bio-Linux no depende de las llamadas.
lanzamiento continuo o entrega continua de software actualizado,
ya en el llamado ciclos de desarrollo con plazos predefinidos (18). En particular, el equipo de Debian-Med
compila y empaqueta el código fuente de su software bioinformático para Debian-Med. Después de las pruebas
en Debian, se está trabajando en una versión adecuada para Ubuntu, a partir de la cual el equipo de Bio-Linux
desarrolla una versión específica de Bio-Linux. El problema es que todo ocurre en ciclos de dos años. Aunque
desde el punto de vista de la ingeniería de software es una opción mucho más favorable, este enfoque puede
llevar al hecho de que las últimas versiones de Bio-Linux no estén instaladas en las últimas versiones de los
programas bioinformáticos. Para superar esto, se decidió crear repositorios propios para instalar software
adicional, así como para actualizarlo. Además, las nuevas versiones del software, preparadas por el equipo de
Bio-Linux, se envían a los equipos de Ubuntu y Debian para su verificación y procesamiento posterior. Existe otra
forma llamada retrotransferencia (ing. backporting), que se refiere a descargar manualmente paquetes desde la
última versión del sistema operativo, modificarlos usando las herramientas de desarrollo de Ubuntu (ing. Ubuntu-
dev-tools), probar en versiones anteriores, subir a servidores oficiales de Ubuntu y redacción de informes (todo
debe ser aprobado por los principales diseñadores de Ubunutu) (18).
Figura 1 Escritorio Bio-Linux 8.0, ventanas del directorio de documentación de Bio-Linux y datos de muestra, con
abrir documento Introducción a Bio-Linux.
Cuando se trata de comodidad, funcionalidad y apariencia del escritorio, Bio-Linux debe su nombre al conocido
frente gráfico Unity. Hay un menú separado para el software de bioinformática y directorios separados para
documentación y datos de prueba. La Figura 1 muestra la interfaz gráfica de Bio-Linux 8.0 con la ventana del
directorio de documentación y datos de muestra de Bio-Linux abierta.
Desde un punto de vista conceptual, es más fácil para los usuarios trabajar con el software, ya sea que hayan
encontrado Linux antes o no. La instalación de diferentes software científicos puede provocar diferentes tipos de
colisiones. Es en tales situaciones
Requiere un mayor conocimiento técnico sobre el software en sí, el sistema operativo, el proceso de
instalación y, por supuesto, tiempo para realizar las configuraciones necesarias. Bio-Linux, como sistema
operativo y como colección de una gran cantidad de software bioinformático, resuelve este problema
ofreciendo todo en un paquete: probado, ajustado y sincronizado. La Tabla 1 muestra los principales
requisitos que definieron el desarrollo de Bio-Linux, así como los pasos dados a lo largo del camino (11).
Tabla 1 Presentación de los requisitos que definieron el desarrollo de Bio-Linux.
Existen bastantes distribuciones de Linux que han sido modificadas y adaptadas a las necesidades de las
ciencias de la vida y la bioinformática (15) (13) (14) . Su número indica que desde hace mucho tiempo existe el
deseo de contar con una plataforma bioinformática uniforme. Muchos de ellos son ahora proyectos muertos, pero
normalmente la experiencia adquirida durante su desarrollo se transfirió al desarrollo de otros. La Tabla 2 ofrece
una descripción general de las características generales del sistema de diferentes distribuciones de Linux
bioorientadas: arquitectura de 32/64 bits, cantidad mínima de RAM requerida, si son gratuitas, disponibilidad
pública del código y cuál es su estado. El criterio para la penúltima característica fue la disponibilidad del proyecto
a través de uno de los servicios de almacenamiento y control de versiones basados en la web (por ejemplo,
GitHub, SourceForge, Assembla), a través del sitio web oficial de la distribución, o si es posible conectarse al
proyecto. sí mismo. De lo contrario, consideramos que el código de distribución apropiado no está disponible
públicamente. Por supuesto, es difícil esperar disponibilidad para un proyecto desactivado, independientemente
de cuál fuera la situación en principio, porque un equipo independiente de desarrolladores no puede iniciar el
desarrollo de forma independiente. Hemos basado la información de estado en los datos que pudimos obtener a
través de los sitios web oficiales y DistroWatch.com.
Tabla 2 Presentación comparativa de las características generales del sistema de diferentes distribuciones bioorientadas
linux
PhyLIS Sí Sí 512 MB Sí No No
Lxtoo Sí Sí 512 MB Sí No No
no hay ninguno
Baari Sí No Sí No No
ppdatos
BioSLAX Sí No 256 MB Sí No No
biocervecería Sí No 512 MB Sí No No
no hay ninguno
BioLinuxBR Sí No Sí No No
ppdatos
no hay ninguno
BioTierra Sí No Sí No No
ppdatos
Descubrimiento abierto Sí No 512 MB Sí No No
Recientemente, la virtualización está ganando impulso, por lo que la existencia de formatos .iso y .ova
apropiados es inevitable. Además, creemos que es importante que exista la posibilidad de descargar
la imagen del sistema operativo a través de tecnología P2P (ing. peer-to-peer) (por ejemplo,
BitTorrent, Gnutella, Freenet). Además del hecho de que está disponible la versión completa de
instalación de la distribución, es deseable poder utilizarla en forma de unidad flash/ DVD de arranque
(la llamada versión terminada). La presentación de las características mencionadas se da en las
tablas 4 y 5.
Tabla 4 Disponibilidad de distribuciones.
Hecho
. ISO . Éste P2P Instalar. Versión
variante
Bio-Linux Sí Sí Sí Sí Sí
vlinux Sí No No Sí No
Vigyaan Sí No No Sí No
Linux científico Sí Sí No Sí Sí
Fedora científica Sí No Sí Sí Sí
Tabla 5 Características generales del mantenimiento del sistema.
Suplementario
Una posibilidad
Última edición LT bioinformática
retrotransferencia
repositorio
Bio-Linux en 2014 Sí Sí Sí
vlinux en 2011 No No No
Vigyaan en 2005 No No No
Linux científico en 2016 Sí No No
Fedora científica en 2016 No No No
Dado que se puede observar que VLinux y Vigyaan son exclusivamente variantes listas para usar
(ing. versiones en vivo) y también bastante desactualizadas, las excluiremos de una mayor
consideración. En la siguiente tabla tenemos una comparativa que se refiere esencialmente a la
comodidad de familiarizarse con un software bioinformático. En términos de actualizaciones, podemos
notar que ScientificLinux y Fedora Scientific lideran el camino. En el caso de la segunda distribución,
esto es de esperar, dado que el ciclo de desarrollo es de sólo seis meses. Por otro lado, las
distribuciones de orientación científica mencionadas no tienen posibilidad de retrotransferencia, ni
cuentan con repositorios bioinformáticos complementarios, característica de Bio-Linux. En pocas
palabras, aunque la última versión de Bio-Linux vio la luz en 2014, debido al soporte a largo plazo, los
repositorios complementarios y las retrotransferencias, pertenece a los sistemas actualizados
oportunamente.
Tabla 6 Menú especial para bioinformática, datos de pruebas, soporte y documentación.
Como podemos ver en la Tabla 6, Scientific Linux y Fedora Scientific, aunque son distribuciones de primer nivel
orientadas a la ciencia, no contienen datos de prueba ni documentación de respaldo para el software de
bioinformática.
Hacia el final, llega el momento de ver cuál es la situación en lo que respecta a software bioinformático
específico. Por supuesto, difícilmente podríamos comparar en un espacio reducido lo que se puede
instalar y lo que no en estas tres distribuciones. Sin embargo, en la tabla 7 hemos mostrado la
situación de una pequeña parte de la familia de software dada. Se trata de la disponibilidad de algunos
de los paquetes bioinformáticos más famosos, como se presentó en un momento en el artículo (14).
Observamos que en ese trabajo se compararon otras distribuciones que hoy ya podemos considerar
obsoletas (tabla 2).
Tabla 7 Disponibilidad de algunos de los paquetes de bioinformática más populares.
Como puede observarse, Scientific Linux y Fedora Scientific representan plataformas muy buenas y
adecuadas para la bioinformática, pero todavía están rezagadas en lo que respecta a
comodidad, cantidad de software bioinformático más reciente, documentación, disponibilidad de datos
de prueba y sincronización del software instalado. Más adelante, en el artículo, hablaremos de
algunas otras características que distinguen a Bio-Linux en comparación con estas dos distribuciones
que por lo demás son muy buenas.
La Figura 2 muestra un ejemplo de una comparación de una secuencia de proteínas seleccionada al azar con una
base de datos de secuencias de proteínas. Como puede verse, la secuencia dada coincide completamente con las tres
proteínas presentes en el virus del herpes humano. Para pequeñas cantidades de datos, donde desea buscar en las
bases de datos disponibles, un servicio web es definitivamente una buena opción. Por otro lado, trabajar a través de la
línea de comando permite funciones adicionales.
configuración de búsqueda, procesamiento de grandes cantidades de datos,automatización, y la
posibilidad de acceder sólo a la información deseada (filtrado).
La Figura 3 muestra el resultado de la comparación de dos secuencias: una genómica, que representa parte del
registro HTG de GenBank y que también contiene una parte del gen del síndrome de Werner, el gen WRN (ing.
síndrome de Werner, WRN), y la secuencia de ARNm (ADNc). El gen WRN contiene 35 exones. El gráfico
BLAST muestra el mapeo de exones en el sistema de coordenadas del ADNc. Las secuencias de nucleótidos
que se examinan, es decir, secuencias cuya similitud se busca, deben "pegarse" en un campo determinado.
BLAST tiene la tarea de encontrar qué exón, si lo hay, está contenido en la secuencia HTG, cuando el
mencionado anteriormente se compara con la secuencia de ADNc del gen WRN. En la figura 3 adjunta, se ve
claramente que la secuencia de nucleótidos de 116-233 es la misma que la secuencia de nucleótidos de 954-
1071 de la secuencia de ADNc y, por tanto, se determina que las coordenadas de ADNc corresponden al exón
número 8.
Este ejemplo podría ejecutarse exitosamente en las tres distribuciones, pero Scientific Linux y Fedora Scientific
requirieron la instalación de BLAST y configuración adicional, es decir. configurando las llamadas variables
"montables" PATH (sistema) y BLASTDB (software), descargando las bases de datos apropiadas, validación y
similares. Es decir, teniendo en cuenta este ejemplo, el papel del software previamente configurado, probado y
sincronizado no es insignificante, especialmente a la hora de dar los primeros pasos bioinformáticos.
Cabe destacar que, además de ser una plataforma de análisis bioinformático, el propio Bio-Linux fue concebido
desde un principio como una especie de ayuda educativa, a diferencia de las otras dos distribuciones
mencionadas. A grandes rasgos, se proporcionan dos cosas:
Según (7), hay dos fases (dos subidas pronunciadas en la curva de aprendizaje) en el conjunto de
habilidades bioinformáticas para el análisis de datos de SNP:
1. transición de sesiones interactivas a programación y desarrollo de aplicaciones
bioinformáticas
2. trabajar en sistemas informáticos en red/agrupados.
Ambas transiciones requieren cambios en la forma de pensar sobre el análisis en sí, incluida la adaptación para
trabajar en un nuevo entorno computacional.
Programático
secuencias de comandos, CLI
pedidos
Figura 4 Dos ascensos pronunciados en la curva de aprendizaje durante la adquisición de habilidades bioinformáticas generales.
En lo que respecta a la primera fase, es realmente necesario permitir a los estudiantes aprender en un entorno lo
más similar posible al que utilizarán en su futuro trabajo de investigación. Es decir, una plataforma bioinformática
educativa debe contener, además de multitud de software bioinformático, las herramientas informáticas más
conocidas, o al menos una opción para su instalación automática:
- compiladores para los lenguajes de programación más famosos utilizados por la comunidad
bioinformática: Perl, C/C++, Python, R, BASH
- paquetes de software para cálculos científicos
- herramientas de desarrollo: editores (por ejemplo, Nano, Gvim, Gedit, Kate), emuladores de shell de
texto (por ejemplo, Terminal, IPython), Make, entornos de desarrollo integrados (por ejemplo,
Eclipse)
Por otro lado, es decir. En lo que respecta a la segunda fase, el problema es que el número de formas de
almacenar datos experimentales obtenidos mediante los métodos de secuenciación actuales se ha "explotado".
Con el rápido desarrollo de la biotecnología y, por tanto, de la bioinformática,
Surgen otros problemas en relación con el almacenamiento, clasificación, búsqueda y uso de datos biológicos.
Los datos están literalmente dispersos en varios almacenes, cuyo número aumenta cada día y, sobre todo, los
formatos de almacenamiento también difieren. Además, algunos de esos formatos no son adecuados para el
procesamiento informático automático y deben pasar por el llamado preprocesamiento, antes de utilizar los
algoritmos apropiados. En otras palabras, el desarrollo de la bioinformática está directamente relacionado con el
llamado "problema de big data": una enorme cantidad de datos heterogéneos, complejos e insuficientemente
estructurados supera las posibilidades del procesamiento tradicional (20). La integración de datos puede, hasta
cierto punto, resolver algunos de los problemas relacionados con el fenómeno del big data. La combinación de
datos de diferentes fuentes y su análisis conjunto puede proporcionar una visión más compleja de la comprensión
de los fenómenos biológicos, pero el problema mismo de diseñar un sistema para la integración de datos sigue
siendo muy difícil. Para superar las dificultades antes mencionadas, los analistas se enfrentan a dos problemas:
configurar y/o obtener acceso a un sistema informático agrupado y adaptar sus propios scripts y datos de
programación para trabajar eficazmente en un nuevo entorno. Sin embargo, a menudo el proceso de obtención
de acceso para trabajar con un sistema informático en clúster no se desarrolla sin problemas y surgen problemas
relacionados con el trabajo con un shell de texto, especialmente adaptado para un clúster específico. Además,
son frecuentes los fallos operativos relacionados con el suministro de las herramientas de programación y el
software bioinformático necesarios. Afortunadamente, por así decirlo, existe una alternativa: la computación en la
nube.
Con la llegada de la tecnología antes mencionada, los recursos informáticos se pueden alquilar y adaptar a tareas
específicas y, una vez finalizada su ejecución, los recursos proporcionados se dejan para que los utilice otra
persona. En este sentido, la nube informática también es una ayuda educativa muy útil. Sin embargo, todo lo que
se alquila, es decir. El suministro, como cualquier computadora nueva, se presenta en forma de máquinas
virtuales genéricas, lo que requiere adaptar la nube informática a un sistema específico. Es por eso que al mismo
tiempo se lanzó el proyecto hermano CloudBioLinux, creado a partir del proyecto Bio-Linux, como un grupo
(virtual) de máquinas disponibles para todos para el llamado. cálculos altamente exigentes en bioinformática (ing.
computación bioinformática de alto rendimiento) (21). Técnicamente, ClaudBioLinux es un conjunto de scripts de
programación adecuados que permiten configurar el ya conocido entorno Bio-Linux, disponible para trabajar en la
nube. Así como el propio sistema operativo se puede cargar fácilmente desde una unidad flash para proporcionar
un entorno didáctico coherente, también se puede formar un clúster (de laboratorio) en un proveedor adecuado
(por ejemplo, Amazon EC2) con sólo unos pocos clics del ratón. La configuración estándar sin modificaciones de
CloudBioLinux ya está lista para cumplir con una amplia gama de requisitos educativos modernos. Por tanto,
creemos que podemos afirmar con razón que Bio-Linux es una opción más receptiva en comparación con las
distribuciones Scientific Linux y Fedora Scientific, que también permiten trabajar en la nube, pero requieren
configuraciones adicionales no tan triviales.
La bioinformática, como disciplina, se está desarrollando muy rápidamente, por lo que requiere una
mejora y actualización constante de conocimientos. Tendencias contemporáneas en biología.
La investigación requiere cada vez más uso de sistemas informáticos. Hay
la necesidad real de superar la brecha entre los programadores, por un lado, y los biólogos, por el
otro, así como hacer que la cooperación mutua sea lo más cómoda posible. Además, ese enfoque
tiene ventajas económicas obvias. En cuanto a los requisitos para una plataforma de software ideal,
resulta que los más cercanos en su cumplimiento son los sistemas de software libre con código
disponible públicamente, especialmente porque la mayor parte del software de
bioinformática de alta calidad se desarrolló para el llamado Sistemas POSIX. uno de
Una de las soluciones propuestas, que está ganando cada vez más popularidad, es el sistema
operativo Bio-Linux. Aunque el proyecto no tiene una historia muy larga, su potencial es evidente.
Proyectos de este tipo y similares, cuyo grupo objetivo son los biólogos-investigadores, tienen como
objetivo formar una nueva generación de biólogos con formación informática, es decir. bioinformático.
El artículo compara las características de diferentes distribuciones bioorientadas, sobre la base de las
cuales es fácil llegar a la conclusión de que Bio-Linux es actualmente la única distribución integral y
puramente bioorientada entre ellas, y que puede satisfacer plenamente a los profesionales y
Requerimientos didácticos de la comunidad bioinformática. Además, la comparación se amplió a las
dos distribuciones orientadas a la ciencia general más populares actualmente: Scientific Linux y
FedoraScientific. Aunque estas dos distribuciones "califican mejor" en comparación con Bio-Linux
cuando se trata de la última actualización del sistema, aún es fácil ver que Bio-Linux es lade
factoestablecer ciertos estándares para todos futuros sistemas operativos bioorientados,
especialmente en lo que respecta a aspectos didácticos y el uso de tecnología en la nube. Como ya
se ha mencionado, estas dos cosas requieren uniformidad incluso cuando se trata de cuestiones
altamente técnicas, lo que es otra razón para la
orientación hacia Bio-Linux. t Además se da un ejemplo de uso. BLAST, que ciertamente se podía
ejecutar en las tres distribuciones mencionadas, pero en las dos últimas requería instalación y ajuste
adicional del software. En esencia, se ve la ventaja de obtener un producto terminado, actualizado y
probado, con todos los datos de prueba, lo que permite al usuario centrarse inmediatamente en
problemas bioinformáticos específicos que, como ya hemos dicho, son demasiado exigentes para
perder el tiempo en ellos. cualquier cosa.
En cuanto a los desafíos desde el ámbito social de la bioinformática, se nota una falta de
bioinformáticos capacitados no sólo en nuestro país sino también en el mundo. Es posible que la
bioinformática en sí misma parezca bastante difícil y confusa. Una de las soluciones podría ser la
introducción de estudios integrados. De este modo, tanto los informáticos como los biólogos estarían
mucho más familiarizados con las soluciones de software existentes para tareas biológicas, con
plataformas biológicas operativas y, por supuesto, Bio-Linux encontraría su lugar entre ellas. Por
supuesto, cabe señalar que algo está sucediendo en la región en este tema. Linux en sí ya no es un
enigma; además, el 4 de junio de 2011 tuvo lugar en Banja Luka la conferencia mundial de
programadores de Linux/Debian (22). Por otro lado, en Belgrado (República de Serbia) se creó el
Centro de Bioinformática, formado por un grupo de científicos, profesores de la Facultad de
Matemáticas, cuyo trabajo es significativo en muchos sentidos y contribuyó al desarrollo de esta
ciencia. . La mayor parte de la investigación se centró en los cambios en la estructura de las
proteínas contenidas en las células procarióticas y, como resultado final, se creó una base de datos
disponible públicamente llamadaBase de datos sobre trastornos procariotas (23).
2.Bioinformática: un concepto de trabajo.Hesper, B y Hogeweg, P.6, 1970, Camaleón, vol. 1, págs. 28-29.
3.Las raíces de la bioinformática en la biología teórica.Hogeweg, Paulien y Searls, David B.[ed.] David B.
Searls. 3, 2011, PLoS Comput Biol., vol. 7, pág. e1002021. doi: 10.1371/journal.pcbi.1002021.
4.Bioinformática.Bayat, Ardeshir.7344, 2002, BMJ: Revista médica británica, vol. 324, págs. 1018-1022.
Chipre: sn, 2012. Actas de la 12.ª Conferencia Internacional sobre Bioinformática y Bioingeniería (BIBE) del IEEE
8.BioFOSS: una encuesta sobre software libre/de código abierto en bioinformática.Shabaga, K y alemán, D.sl: IEEE,
2006. Sistemas médicos basados en computadora. DOI: 10.1109/CBMS.2006.60.
9.Cómo Perl salvó el Proyecto Genoma Humano.Stein, L.2, sl: The Perl Journal, febrero de 1996, vol.
1.
10.Secuenciación del virus del SARS.Krzywinski, M.Noviembre de 2003, LINUX Journal, vol. 115.
11.Software abierto para biólogos: de la hambruna al festín.Campo, Dawn, et al., et al.7, julio de 2006, Nature
12.Levin, Barry.El creador conmemora el 22.º cumpleaños de Linux, sutilmente.CMSWire.com. [En línea] Simpler
management/linux-22th-birthday-is-commemoated-subtly-bycreator- 022244.php.
13.Distribuciones de Linux personalizadas impulsadas por las ciencias biológicas.Wajid, B y Serpedin, E.1, 18 de enero de
15.El patio de recreo de la bioinformática.Tiwari, B y Field, D.2005, Usuario y desarrollador de Linux, vol. 46, págs.
50-56.
16.Gelbmann, Matías.Tecnologías Web del Año 2015.W3Techs.[En línea] 4 de enero de 2016. [Citado:
18.Impactando el progreso de las biociencias mediante el respaldo de software para Bio-Linux.Paporovic, Sasa.arXiv,
20.Adaptación de los planes de estudios de bioinformática para big data.Greene, Anna C., et al., et al.2015,
22.Ministerio de Ciencia y Tecnología de la República de Srpska.Informe de auditoría financiera informes del Ministerio de
Ciencia y Tecnología de la República de Srpska para el período comprendido entre el 1 de enero y el 31 de diciembre de
2011. Baoa Luka: El principal servicio de auditoría del sector público de la República de Srpska,en 2012
et al., et al.66, 2011, BMC Bioinformática, vol. 12, págs. 1-22. DOI: 10.1186/1471-2105-12-66.