0% encontró este documento útil (0 votos)
461 vistas12 páginas

Apuntes Lenguaje de Marcas

Este documento describe los lenguajes de marcas, su evolución e historia. Explica conceptos como XML, HTML y SGML, y cómo XML resolvió algunos problemas de HTML. También cubre temas como etiquetas, herramientas de edición y la estructura y sintaxis básicas de XML.

Cargado por

Raul Fernandez
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
461 vistas12 páginas

Apuntes Lenguaje de Marcas

Este documento describe los lenguajes de marcas, su evolución e historia. Explica conceptos como XML, HTML y SGML, y cómo XML resolvió algunos problemas de HTML. También cubre temas como etiquetas, herramientas de edición y la estructura y sintaxis básicas de XML.

Cargado por

Raul Fernandez
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

APUNTES LENGUAJE DE MARCAS

1.- Lenguajes de marcas.

Modo de codificar un documento donde, junto con el texto, se incorporan etiquetas, marcas
o anotaciones con información adicional sobre la estructura del texto o su formato de
presentación.

Permiten hacer explícita la estructura de un documento, su contenido semántico o cualquier


otra información lingüística o extralingüística que se quiera hacer patente.

En la práctica, en un mismo documento pueden combinarse varios tipos diferentes de


lenguajes de marca, éstos se pueden clasificar como:

 De presentación: Define el formato del texto.


 De procedimientos: Orientado también a la presentación, pero, en este caso, el
programa que representa el documento debe interpretar el código en el mismo orden
en que aparece.
 Descriptivo o semántico: Describen las diferentes partes en las que se estructura el
documento, pero sin especificar cómo deben representarse.

Clasificación por ámbito de utilización: Documentación electrónica:

RTF (Rich Text Format): Formato de Texto Enriquecidointercambio de documentos de texto ente distintos
procesadores de texto.
TeX: creación de ecuaciones matemáticas complejas.
Wikitexto: Permite la creación de páginas wiki en servidores preparados para soportar este lenguaje.
DocBook: Permite generar documentos separando la estructura lógica del documento de su formato. Esos
documentos, pueden publicarse en diferentes formatos sin necesidad de realizar modificaciones en el
documento original.

Tecnologías e internet:

HTML, XHTML: (Hypertext Markup Language, eXtensible Hypertext Markup Language): Su objetivo es la
creación de páginas web.
RSS: Permite la difusión de contenidos web
Otros lenguajes especializados

MathML (Mathematical Markup Language): Su objetivo es expresar el formalismo matemático de tal modo
que pueda ser entendido por distintos sistemas y aplicaciones.
VoiceXML (Voice Extended Markup Language) tiene como objetivo el intercambio de información entre un
usuario y una aplicación con capacidad de reconocimiento de habla.
MusicXML: Permite el intercambio de partituras entre distintos editores de partituras.
[Link]ón de los lenguajes de marcas.

-GML (Generalized Markup Language).

Problema de falta de estandarización en los formatos de información usados por los distintos
programas solución  IBM encargó a Charles F. Goldfab (años sesenta) la construcción de
un sistema de edición, almacenamiento y búsqueda de documentos legales.

Resultado GML, cuyo objetivo era describir los documentos de tal modo que el resultado
fuese independiente de la plataforma y la aplicación utilizada.

-SGML (Standard Generalized Markup Language).

GML evolucionó al estándar ISO 8879 que se denominó SGML (1986)

Lenguaje muy complejo y requería de unas herramientas de software caras. Por ello su uso ha
quedado relegado a grandes aplicaciones industriales.

- HTML (HyperText Markup Language).

1989/90 Tim Berners-Lee creó el World Wide Web necesidad de organizar, enlazar y
compatibilizar gran cantidad de información procedente de diversos sistemas.

Se creó un lenguaje de descripción de documentos llamado HTML, que era una combinación
de dos estándares ya existentes:

 ASCII: Es el formato que cualquier procesador de textos sencillo puede reconocer y


almacenar. Por tanto, es un formato que permite la trasferencia de datos entre
diferentes ordenadores.
 SGML: Lenguaje que permite dar estructura al texto, resaltando los títulos o aplicando
diversos formatos al texto.

HTML es una versión simplificada de SGML, ya que sólo se utilizaban las instrucciones
absolutamente imprescindibles. Era tan fácil de comprender que rápidamente tuvo gran
aceptación logrando lo que no pudo SGML, HTML se convirtió en un estándar general para la
creación de páginas web. Además, tanto las herramientas de software como los navegadores
que permiten visualizar páginas HTML son cada vez mejores.

Principales desventajas son:

1. No soporta tareas de impresión y diseño.


2. El lenguaje no es flexible, ya que las etiquetas son limitadas.
3. No permite mostrar contenido dinámico.
4. La estructura y el diseño están mezclados en el documento.
Ejemplo HTML

Al publicarlo en un navegador, por ejemplo, en el Firefox, tendríamos:

- XML (eXtensible Markup Language).

Los archivos XML se componen de etiquetas, que nos dan datos e información que
queremos procesar. Estas etiquetas pueden venir de forma individual o anidadas.

Para resolver estos problemas de HTML el W3C establece, en 1998, el estándar internacional
XML.

Un lenguaje de marcas puramente estructural que no incluye ninguna información relativa al


diseño. A diferencia de HTML las etiquetas indican el significado de los datos en lugar del
formato con el que se van a visualizar los datos.

XML es un metalenguaje caracterizado por:

 Permitir definir etiquetas propias.


 Permitir asignar atributos a las etiquetas.
 Utilizar un esquema para definir de forma exacta las etiquetas y los atributos.
 La estructura y el diseño son independientes.

En realidad, XML es un conjunto de estándares relacionados entre sí y que son:

 XSL, eXtensible Style Language. Permite definir hojas de estilo para los documentos
XML e incluye capacidad para la transformación de documentos.
 XML Linking Language, incluye Xpath, Xlink y Xpointer. Determinan aspectos sobre los
enlaces entre documentos XML.
 XML Namespaces. Proveen un contexto al que se aplican las marcas de un documento
de XML y que sirve para diferenciarlas de otras con idéntico nombre válidas en otros
contextos.
 XML Schemas. Permiten definir restricciones que se aplicarán a un documento XML.
Actualmente los más usados son las DTD.

- Comparación de XML con HTML.

XML SGML
Sencillo Complejo
Trabaja con documentos bien formados, NO Sólo documentos válidos-
exige que estén validados.
Facilita el desarrollo de aplicaciones de bajo Por su complejidad, las aplicaciones
coste. informáticas para procesar SGML sean muy
costosas.
Muy utilizado Solo en sectores muy específicos
Compatibilidad e integración con HTML No compatibilidad con HTML definida.
Formateos y estilo fáciles de aplicar Formateo y estilo complejos.
No usa etiquetas opcionales

¿Cuáles son las características comunes de XML y SGML?

GUARDAN LA ESTRUCTURA LÓGICA DE LOS DOCUMENTOS.


3.- Etiquetas.

Los lenguajes de marcas utilizan una serie de etiquetas especiales intercaladas en un


documento de texto sin formato. Dichas etiquetas serán posteriormente interpretadas por los
intérpretes del lenguaje y ayudan al procesado del documento.

 Se escriben encerradas entre ángulos, es decir < y >.


 Normalmente, se utilizan dos etiquetas: una de inicio y otra de fin para indicar que ha
terminado el efecto que queríamos presentar.
 La única diferencia entre ambas es que la de cierre lleva una barra inclinada "/" antes
del código.
 Las últimas especificaciones emitidas por el W3C indican la necesidad de que vayan
escritas siempre en minúsculas para considerar que el documento está correctamente
creado.

4.- Herramientas de edición.

Para trabajar en XML es necesario editar los documentos y luego procesarlos, por tanto,
tenemos dos tipos de herramientas:

Editores XML Los ML se basan en la utilización de ficheros de texto plano por lo que basta
utilizar un procesador de texto normal para construir un documento XML.

+Para crear documentos XML complejos  editor XML. Estos nos ayudan a crear estructuras y
etiquetas de los elementos usados en los documentos, además algunos incluyen ayuda para la
creación de otros elementos como DTD, hojas de estilo CSS o XSL, ... El W3C ha desarrollado un
editor de HTML, XHTML, CSS y XML gratuito cuyo nombre es Amaya.

Procesadores XML Para interpretar el código XML se puede utilizar cualquier navegador.
Los procesadores de XML permiten leer los documentos XML y acceder a su contenido y
estructura.

Un procesador es un conjunto de módulos de software entre los que se encuentra un parser o


analizador de XML que comprueba que el documento cumple las normas establecidas para
que pueda abrirse. Estas normas pueden corresponderse con las necesarias para trabajar sólo
con documentos de tipo válido o sólo exigir que el documento esté bien formado, primeros se
conocen como validadores y los segundos como no validadores. El modo en que los
procesadores deben leer los datos XML está descrito en la recomendación de XML establecida
por W3C.

+Por tanto, para crear documentos XML es necesario: bastaría un blog de notas y un
navegador

5.-XML: estructura y sintaxis.

El XML, o Lenguaje de Etiquetas Extendido, es lenguaje de etiquetas, creadas por el


programador, que estructuran y guardan de forma ordenada la información. No representa
datos por sí mismo, solamente organiza la estructura.

El XML ahorra tiempos de desarrollo y proporciona ventajas, dotando a webs y a aplicaciones


de una forma realmente potente de guardar la información. Además, se ha convertido en un
formato universal que ha sido asimilado por todo tipo de sistemas operativos y dispositivos
móviles.

Al igual que en HTML un documento XML es un documento de texto extensión ".xml",


compuesto de parejas de etiquetas, estructuradas en árbol, que describen una función en la
organización del documento, que puede editarse con cualquier editor de texto y que es
interpretado por los navegadores Web.

Las características básicas de XML son:

 Dado que XML se concibió para trabajar en la Web, es directamente compatible con
protocolos que ya funcionan, como HTTP y los URL.
 Todo documento que verifique las reglas de XML está conforme con SGML.
 No se requieren conocimientos de programación para realizar tareas sencillas en XML.
 Los documentos XML son fáciles de crear.
 La difusión de los documentos XML está asegurada ya que cualquier procesador de
XML puede leer un documento de XML.
 El marcado de XML es legible para los humanos.
 El diseño XML es formal y conciso.
 XML es extensible, adaptable y aplicable a una gran variedad de situaciones.
 XML es orientado a objetos.
 Todo documento XML se compone exclusivamente de datos de marcado y datos
carácter entremezclados.

Etapas de creación de un documento XMl:

1. Especificación de requisitos.
2. Diseño de etiquetas.
3. Marcado de los documentos.

El marcado en XML son etiquetas que se añaden a un texto para estructurar el contenido del
documento. Esta información extra permite a los ordenadores "interpretar" los textos. El
marcado es todo lo que se sitúa entre los caracteres "<" y ">" o "&" y ";"
Los datos carácter son los que forman la verdadera información del documento XML.

El marcado puede ser tan rico como se quiera. Puede ser interesante detectar necesidades
futuras y crear documentos con una estructura fácilmente actualizables.

Comentarios Los documentos XML pueden tener comentarios, que no son interpretados
por el interprete XML. Estos se incluyen entre las cadenas "<!-" y "-->", pueden estar en
cualquier posición en el documento salvo:

 NO COMENTARIOS antes del prólogo.


 NO COMENTARIOS dentro de una etiqueta.

Los documentos XML pueden estar formados por una parte opcional llamada prólogo y otra
parte obligatoria llamada ejemplar.

5.1.- El prólogo Precede al ejemplar del documento y facilita el procesado de la información


del ejemplar. El prólogo está dividido en dos partes:

La declaración XML: En el caso de incluirse ha de ser la primera línea del documento, de no ser
así se genera un error que impide que el documento sea procesado.

Como es opcional permite procesamiento de documentos HTML y SGML como si fueran


XML. (Si fuera obligatoria éstos deberían incluir una declaración de versión XML que no tienen).

Funciones:

1. Declarar la versión de XML usada para elaborar el documento


<?xml versión= “1.0” ?>
2. Declaración de la codificación empleada para representar los caracteres.
<?xml versión= “1.0” encoding=”iso-8859-1” ?>
(el código iso-8859-1 (Latin-1) que permite el uso de acentos o caracteres como la ñ.).
Códigos importantes:

3. Declaración de la autonomía del documento.


Informa de si el documento necesita de otro para su interpretación. Para declararlo
hay que definir el prólogo completo:
<?xml versión= “1.0” encoding=”iso-8859-1” standalone=”yes” ?>
Al escribir standalone="yes" se está indicando que el documento es independiente
de otros, como por ejemplo de una DTD (Document Type Definition, Definición de
Tipo de Documento) externa. En caso contrario, significará que el documento no es
independiente.
La declaración del tipo de documento, define qué tipo de documento estamos creando para
ser procesado correctamente. Toda declaración de tipo de documento comienza por la
cadena: <!DOCTYPE Nombre_tipo ...>

5.2.- El ejemplar. Los elementos.

La parte más importante, contiene los datos reales del documento. Formados por elementos
anidados.

Los elementos son los distintos bloques de información que permiten definir la estructura de
un documento XML. Está, delimitados por una etiqueta de apertura y una etiqueta de cierre. A
su vez los elementos pueden estar formados por otros elementos y/o por atributos.

El ejemplar es el elemento <libro>, que a su vez está


compuesto de los elementos <autor>, <editorial>, <isbn>,
<edicion> y <paginas>.2626

El ejemplar es el elemento raíz de un documento XML.


Todos los datos de un documento XML han de pertenecer a
un elemento del mismo.

Reglas:

En todo documento XML debe existir SOLO un elemento raíz.

1-Todos los elementos tienen una etiqueta de inicio y otra de cierre.

2-Si hay elemento vacío2 opciones <elemento></elemento> o <elemento/>

Al anidar elementosNO puede cerrarse un elemento que contenga algún otro elemento
que aún no se haya cerrado.

3-Los nombres de las etiquetas de inicio y de cierre de un mismo elemento han de ser
IDÉNTICOS, respetando las mayúsculas y minúsculas.

Pueden ser cualquier cadena alfanumérica que no contenga espacios y no comience ni por
":", ni por la cadena "xml" ni ninguna de sus versiones ("XML", "XmL", "xML",...).

NO SE PUEDE USAR:

"]]>" (por compatibilidad con SGML)

>, <, &, ", ‘. (&:ampersand)


En el caso de tener que utilizar estos caracteres se sustituyen por las siguientes cadenas:

Carácter Cadena Carácter Cadena Carácter Cadena


> &gt; & &amp; ‘ &apos;
< &lt; " &quot;
4-Caracteres especiales, como £, ©, ®,... hay que usar las expresiones &#D; o &#H; donde D y
H se corresponden respectivamente con el número decimal o hexadecimal correspondiente al
carácter que se quiere representar en el código UNICODE. Por ejemplo, para incluir el carácter
de Euro, €, se usarían las cadenas &#8364; o &#x20AC;

[Link]

5.2.1.- Atributos.

Permiten añadir propiedades a los elementos de un documento. Los atributos no pueden


organizarse en ninguna jerarquía, no pueden contener ningún otro elemento o atributo y no
reflejan ninguna estructura lógica.

No se debe utilizar un atributo para contener información susceptible de ser dividido.


<?xml version="1.0" encoding="iso-8859-1" standalone="yes" ? > -Prologo:
<!DOCTYPE biblioteca > declaración XML:
<biblioteca>. Versión,
<ejemplar tipo_ejem="libro" titulo="XML práctico" editorial="Ediciones Eni">
codificación, no
<tipo> <libro isbn="978-2-7460-4958-1" edicion="1" paginas="347"></libro> </tipo>
independiente.
<autor nombre="Sebastien Lecomte"></autor>
<autor nombre="Thierry Boulanger"></autor> -Prologo:
<autor nombre="Angel Belinchon Calleja" funcion="traductor"></autor> declaración del
<prestado lector="Pepito Grillo"> tipo de
<fecha_pres dia="13" mes="mar" año="2009"></fecha_pres> documento.
<fecha_devol dia="21" mes="jun" año="2009"></fecha_devol> -El ejemplar, que
</prestado> a su vez está
</ejemplar> compuesto de los
</biblioteca>
elementos.
-Elementos
-Atributos

Vemos que los elementos aparecen coloreados en ciruela, los nombres de los atributos en
negro y sus valores en azul.
Los atributos se definen y dan valor dentro de una etiqueta de inicio o de elemento vacio, a
continuación del nombre del elemento o de la definición de otro atributo siempre separado
de ellos por un espacio. Los valores del atributo van precedidos de un igual que sigue al
nombre del mismo y tienen que definirse entre comillas simples o dobles.

Los nombres de los atributos han de cumplir las mismas reglas que los de los elementos, y no
pueden contener el carácter menor que, <.

BUSCAR ERROES
<?XML version="1.0" encoding="UTF-8" standalone="yes" ?> El prólogo debe empezar
por xml (minúscula) CORRECTO

<!DOCTYPE biblioteca >

<biblioteca>

<ejemplar tipo_ejem='libro' titulo='XML práctico' editorial='Ediciones Eni'>


SE PUEDEN USAR COMILLAS SIMPLES Y DOBLES
EN LOS DATOS DEL DOCUMENTO SE PUEDEN USAR MAYÚSCULAS

<tipo> <libro isbn='978-2-7460-4958-1' edicion= paginas='347'></libro> </tipo>


atributo edición está vacío

<autor nombre='Sebastien Lecomte'></autor>

<autor nombre='Thierry Boulanger'></autor>

<autor nombre='Angel Belinchon Calleja' funcion='traductor'></autor>

<prestado lector='Pepito Grillo'>

<fecha_pres dia='13' mes='mar' año='2009'></fecha_pres>

<fecha_devol/> CORRECTO

</prestado>

</ejemplar>
</biblioteca>
o El prólogo debe empezar por xml (minúscula)

o El código de caracteres en este caso UTF-8 es adecuado; también podría ser otro.

o Los valores de los atributos pueden estar entre comillas dobles o simples

o En la línea 13 el atributo edición está vacío y esto no está permitido

o La etiqueta <fecha_devol> está vacía de contenido, por lo tanto

se puede “abrir y cerrar”: <fecha_devol>

se puede mostrar como aparece en el ejercicio correctamente <fecha_devol/>

o En los datos del documento se pueden usar mayúsculas.

6.- Documentos XML bien formados.

Todos los documentos XML deben verificar las reglas sintácticas que define la recomendación
del W3C para el estándar XML. Esas normas básicas son:

1. El documento ha de tener definido un prólogo con la declaración xml completa.


2. Existe un único elemento raíz para cada documento: es un solo elemento en el que
todos los demás elementos y contenidos se encuentran anidados.
3. Hay que cumplir las reglas sintácticas del lenguaje XML para definir los distintos
elementos y atributos del documento

7.- Utilización de espacios de nombres en XML.

Varios documentos XML se pueden combinar entre sí, pudiendo en estos casos coincidir el
nombre de algunos elementos.

En el documento, las etiquetas ambiguas se sustituyen por otras en las que el nombre del
elemento está precedido de un prefijo, que determina el contexto al que pertenece la
etiqueta, seguido de dos puntos, :. Esto es:

<prefijo:nombre_etiqueta></prefijo:nombre_etiqueta>
Esta etiqueta se denomina "nombre cualificado". Al definir el prefijo hay que tener en cuenta
que no se pueden utilizar espacios ni caracteres espaciales y que no puede comenzar por un
digito.
Antes de poder utilizar un prefijo de un espacio de nombres, es necesario declarar el espacio de
nombres, es decir, asociar un índice con el URI asignado al espacio de nombres, mediante un
atributo especial xmlns. Esto se hace entre el prólogo y el ejemplar de un documento XML y su
sintaxis es la siguiente:

<conexion>://<direccionservidor>/<apartado1>/<apartado2>/...

EJEMPLO:

Sean los documentos XML que organizan la información sobre los profesores y los alumnos del
DAW respectivamente:

<?xml version="1.0" encoding="iso-8859-1" standalone="yes" ?>


<!DOCTYPE alumnos>
<alumnos>

<nombre>Fernando Fernández González</nombre>


<nombre>Isabel González Fernández</nombre>
<nombre>Ricardo Martínez López</nombre>
</alumnos>

<?xml version="1.0" encoding="iso-8859-1" standalone="yes" ?>


<!DOCTYPE profesores>
<profesores>
<nombre>Pilar Ruiz Pérez</nombre>
<nombre>Tomás Rodríguez Hernández</nombre>
</profesores>

Al hacer un documento sobre los miembros del curso DAW no se distinguirían los profesores
de los alumnos, para resolverlo definiremos un espacio de nombres para cada contexto:

<?xml version="1.0" encoding="iso-8859-1" standalone="yes" ?>


<!DOCTYPE miembros>
<alumnos xlmns:alumnos=”[Link]
<profesores xlmns:profesores=”[Link]
<asistentes>
<alumnos:nombre>Fernando Fernández González</alumnos:nombre>
<alumnos:nombre>Isabel González Fernández</alumnos:nombre>
<alumnos:nombre>Ricardo Martínez López</alumnos:nombre>
<profesores:nombre>Pilar Ruiz Pérez</profesores:nombre>
<profesores:nombre>Tomás Rodríguez Hernández</profesores:nombre>
</asistentes>

También podría gustarte