LENGUAJE DE MARCA
Aunque suene a un concepto publicitario, cuando hablamos de lenguaje de marca en
programación web, estamos hablando de algo bien distinto. Con marca, nos estamos
refiriendo a la forma de codificar un documento o web. Es una forma de definir la
estructura del texto o su presentación a través de etiquetas o marcas. Este tipo de
lenguajes son los que entienden los navegadores. HTML y XML, son los más conocidos.
A diferencia de los lenguajes de programación, el lenguaje de marca no tiene funciones
aritméticas o variables.
El HTML, el lenguaje de marca más conocido
Hyper Text Markup Language es el lenguaje de marcado de hipertexto. Se utiliza en las
páginas y sitios web y fue creado por el padre de la web, Tim Berners Lee en 1989.
El lenguaje HTML es el encargado de definir los contenidos de un sitio web de forma
textual y estructurada. Dicho de otra forma, es el encargado de decirle al navegador web
cómo debe visualizarse el sitio web. Si el título está centrado, en negrita o si tiene un
enlace, por ejemplo, son elementos del marcado en HTML.
Las ventajas de utilizar el HTML son:
• Cualquier modificación del HTML puede hacerse desde un editor de texto.
No es necesario ningún software o conocimiento de programa alguno.
• Puede integrar diferentes tipos de lenguaje de marcas, XML por ejemplo.
Cada lenguaje define sus etiquetas para representar la información de una
forma u otra.
El lenguaje XML
A diferencia del HTML, el lenguaje XML o Extensible Markup Language, etiqueta toda
información, entre dos marcas, pero está separado el contenido de la presentación.
El XML es un lenguaje estándar, independiente, no forma parte de ninguna empresa. Es
la forma segura y fiable de intercambiar información entre diferentes programas.
Clases de lenguajes de marcado
Existen tres clases de lenguajes de marcado, siendo posible la combinación de varias en
un mismo documento. Así pues, el HTML tiene etiquetas procedimentales como, por
ejemplo, la B de 'bold' o negrita.
1. Marcado de procedimientos
Es visible para el usuario que edita los textos, pero se enfoca a la presentación de ellos.
El programa interpreta el código en el orden en el que aparece. Para editar o formatear
un título deben seguir unas directrices en las que se dan instrucciones al software.
2. Marcado de presentación
Es el que indica el formato del texto y se utiliza para maquetar una presentación y que
se pueda leer. Es insuficiente para el procesamiento de la información de manera
automática. Su uso se ha minimizado en grandes proyectos en favor de otros marcados
más estructurados.
3. Marcado descriptivo
También conocido como marcado semántico, se vale de etiquetas para escribir
fragmentos de texto, en los que no especifica el orden o cómo se deben representar.
Estos lenguajes son XML y SGML.
Es un lenguaje muy flexible, ya que los fragmentos se etiquetan como son y no como
deben aparecer. Estos tienen más utilidad de la prevista porque los hiperenlaces se
diseñaron para pulsarlos, pero los buscadores los utilizan para hallar páginas nuevas con
información relacionada y evaluar la popularidad de un sitio.
Evolución de los Lenguajes de Marcas
Los lenguajes de marcas surgieron, inicialmente, como lenguajes formados por el
conjunto de códigos de formato que los procesadores de texto introducen en los
documentos para dirigir el proceso de presentación (impresión) mediante una
impresora. Como en el caso de los lenguajes de programación, inicialmente estos
códigos de formato estaban ligados a las características de una máquina, programa o
procesador de textos concreto y, en ellos, inicialmente no había nada que permitiese al
programador (formateador de documentos en este caso) abstraerse de las
características del procesador de textos y expresar de forma independiente a éste la
estructura y la lógica interna del documento.
Posteriormente, se añadieron como medio de presentación a la pantalla. Los códigos de
estilo de visualización anteriores ya no aparecen, y se emplean otros medios para
marcados, distintos de la inclusión a mano de cadenas formateadoras, ahora ese
proceso se automatiza y basta pulsar una combinación de teclas, o pulsar un botón, para
lograr los resultados requeridos. Aunque esto es sólo una abstracción, para su uso
interno las aplicaciones siguen utilizando marcas para delimitar aquellas partes del texto
que tienen un formato especial.
Este marcado estaba exclusivamente orientado a la presentación de la información,
aunque pronto se percataron de las posibilidades del marcado y le dieron nuevos usos
que resolvían una gran variedad de necesidades, apareció el formato generalizado.
GML (Generalized Markup Language)
Uno de los problemas que se conocen desde hace décadas en la informática es la falta
de estandarización en los formatos de información usados por los distintos programas.
Para resolver este problema, en los años sesenta IBM encargó a Charles F. Goldfab la
construcción de un sistema de edición, almacenamiento y búsqueda de documentos
legales. Tras analizar el funcionamiento de la empresa llegaron a la conclusión de que
para realizar un buen procesado informático de los documentos había que establecer
un formato estándar para todos los documentos que se manejaban en la empresa. Con
ello se lograba gestionar cualquier documento en cualquier departamento y con
cualquier aplicación, sin tener en cuenta dónde ni con qué se generó el documento.
Dicho formato tenía que ser válido para los distintos tipos de documentos legales que
utilizaba la empresa, por tanto, debía ser flexible para que se pudiera ajustar a las
distintas situaciones.
El formato de documentos que se creó como resultado de este trabajo fue GML, cuyo
objetivo era describir los documentos de tal modo que el resultado fuese independiente
de la plataforma y la aplicación utilizada.
SGML (Standard Generalized Markup Language).
El formato GML evolucionó hasta que en 1986 dio lugar al estándar ISO 8879 que se
denominó SGML. Éste era un lenguaje muy complejo y requería de unas herramientas
de software caras. Por ello su uso ha quedado relegado a grandes aplicaciones
industriales.
HTML (HyperText Markup Language).
En 1989/90 Tim Berners-Lee creó el World Wide Web y se encontró con la necesidad de
organizar, enlazar y compatibilizar gran cantidad de información procedente de diversos
sistemas. Para resolverlo creó un lenguaje de descripción de documentos llamado
HTML, que, en realidad, era una combinación de dos estándares ya existentes:
➢ ASCII: Es una codificación de caracteres que cualquier procesador de textos
sencillo puede reconocer y almacenar. Por tanto, permite la trasferencia de
datos entre diferentes ordenadores.
➢ SGML: Lenguaje que permite dar estructura al texto, resaltando los títulos o
aplicando diversos formatos al texto.
HTML es una versión simplificada de SGML, ya que sólo se utilizaban las instrucciones
absolutamente imprescindibles. Era tan fácil de comprender que rápidamente tuvo gran
aceptación logrando lo que no pudo SGML. HTML se convirtió en un estándar general
para la creación de páginas web. Además, tanto las herramientas de software como los
navegadores que permiten visualizar páginas HTML son cada vez mejores.
A pesar de todas estas ventajas HTML no es un lenguaje perfecto, sus principales
desventajas son:
➢ No soporta tareas de impresión y diseño.
➢ El lenguaje no es flexible, ya que las etiquetas son limitadas.
➢ No permite mostrar contenido dinámico.
➢ La estructura y el diseño están mezclados en el documento.
XML (eXtensible Markup Language)
Para resolver estos problemas de HTML el W3C establece, en 1998, el estándar
internacional XML, un lenguaje de marcas puramente estructural que no incluye
ninguna información relativa al diseño. Está convirtiéndose con rapidez en estándar
para el intercambio de datos en la Web. A diferencia de HTML las etiquetas indican el
significado de los datos en lugar del formato con el que se van a visualizar los datos.
XML es un metalenguaje caracterizado por:
➢ Permitir definir etiquetas propias.
➢ Permitir asignar atributos a las etiquetas.
➢ Utilizar un esquema para definir de forma exacta las etiquetas y los atributos.
➢ La estructura y el diseño son independientes.
XHTML (eXtensible HyperText Markup Language)
XHTML surge en el año 2000, básicamente para expresar el lenguaje HTML como un
lenguaje XML válido, y convertirlo de un lenguaje de marcas de procedimientos a un
lenguaje de marcas descriptivo.
Aunque apenas se utiliza en el desarrollo de sitios web, podemos observar cómo la
versión HTML5 y posteriores se han ido desarrollando en este camino, centrándose en
la descripción del contenido y no en su presentación.
Organizaciones encargadas de desarrollar el lenguaje de marcas
International Organization for Standardization (ISO)
La organización ISO fue fundada en 1926 como Federación Internacional de
Asociaciones de Normalización Nacionales (ISA). Durante la II Guerra Mundial, fue
temporalmente suspendida. Tras el estado bélico, las Naciones Unidas propusieron la
refundación de una organización de normalización a través del Comité de Coordinación
de Normas de las Naciones Unidas.
En 1946, representantes de 25 países se reunieron en la ciudad de Londres. Tenían el
objetivo de facilitar la coordinación de los estándares industriales, mediante la
unificación internacional. Fue durante esta reunión cuando pusieron las bases de lo que
se acabaría conociendo como ISO. Finalmente, la organización se fundó oficialmente el
23 de febrero de 1947.
La sede de la ISO está actualmente ubicada en Ginebra, Suiza, y trabaja en 193 países.
World Wide Web Consortium (W3C)
El Consorcio WWW, en inglés: World Wide Web Consortium (W3C), es
un consorcio internacional que genera recomendaciones y estándares que aseguran
el crecimiento de la World Wide Web a largo plazo.3
Este consorcio fue creado en octubre de 1994, y está dirigido por Tim Berners-Lee,
el creador original del URL (Uniform Resource Locator, Localizador Uniforme de
Recursos), del HTTP (HyperText Transfer Protocol, Protocolo de Transferencia de
HiperTexto) y del HTML (Hyper Text Markup Language, Lenguaje de Marcado de
HiperTexto), que son las principales tecnologías sobre las que se basa la Web.