Apuntes Lenguaje de Marcas
Apuntes Lenguaje de Marcas
Modo de codificar un documento donde, junto con el texto, se incorporan etiquetas, marcas
o anotaciones con información adicional sobre la estructura del texto o su formato de
presentación.
RTF (Rich Text Format): Formato de Texto Enriquecidointercambio de documentos de texto ente distintos
procesadores de texto.
TeX: creación de ecuaciones matemáticas complejas.
Wikitexto: Permite la creación de páginas wiki en servidores preparados para soportar este lenguaje.
DocBook: Permite generar documentos separando la estructura lógica del documento de su formato. Esos
documentos, pueden publicarse en diferentes formatos sin necesidad de realizar modificaciones en el
documento original.
Tecnologías e internet:
HTML, XHTML: (Hypertext Markup Language, eXtensible Hypertext Markup Language): Su objetivo es la
creación de páginas web.
RSS: Permite la difusión de contenidos web
Otros lenguajes especializados
MathML (Mathematical Markup Language): Su objetivo es expresar el formalismo matemático de tal modo
que pueda ser entendido por distintos sistemas y aplicaciones.
VoiceXML (Voice Extended Markup Language) tiene como objetivo el intercambio de información entre un
usuario y una aplicación con capacidad de reconocimiento de habla.
MusicXML: Permite el intercambio de partituras entre distintos editores de partituras.
[Link]ón de los lenguajes de marcas.
Problema de falta de estandarización en los formatos de información usados por los distintos
programas solución IBM encargó a Charles F. Goldfab (años sesenta) la construcción de
un sistema de edición, almacenamiento y búsqueda de documentos legales.
Resultado GML, cuyo objetivo era describir los documentos de tal modo que el resultado
fuese independiente de la plataforma y la aplicación utilizada.
GML evolucionó al estándar ISO 8879 que se denominó SGML (1986)
Lenguaje muy complejo y requería de unas herramientas de software caras. Por ello su uso ha
quedado relegado a grandes aplicaciones industriales.
1989/90 Tim Berners-Lee creó el World Wide Web necesidad de organizar, enlazar y
compatibilizar gran cantidad de información procedente de diversos sistemas.
Se creó un lenguaje de descripción de documentos llamado HTML, que era una combinación
de dos estándares ya existentes:
HTML es una versión simplificada de SGML, ya que sólo se utilizaban las instrucciones
absolutamente imprescindibles. Era tan fácil de comprender que rápidamente tuvo gran
aceptación logrando lo que no pudo SGML, HTML se convirtió en un estándar general para la
creación de páginas web. Además, tanto las herramientas de software como los navegadores
que permiten visualizar páginas HTML son cada vez mejores.
Los archivos XML se componen de etiquetas, que nos dan datos e información que
queremos procesar. Estas etiquetas pueden venir de forma individual o anidadas.
Para resolver estos problemas de HTML el W3C establece, en 1998, el estándar internacional
XML.
XSL, eXtensible Style Language. Permite definir hojas de estilo para los documentos
XML e incluye capacidad para la transformación de documentos.
XML Linking Language, incluye Xpath, Xlink y Xpointer. Determinan aspectos sobre los
enlaces entre documentos XML.
XML Namespaces. Proveen un contexto al que se aplican las marcas de un documento
de XML y que sirve para diferenciarlas de otras con idéntico nombre válidas en otros
contextos.
XML Schemas. Permiten definir restricciones que se aplicarán a un documento XML.
Actualmente los más usados son las DTD.
XML SGML
Sencillo Complejo
Trabaja con documentos bien formados, NO Sólo documentos válidos-
exige que estén validados.
Facilita el desarrollo de aplicaciones de bajo Por su complejidad, las aplicaciones
coste. informáticas para procesar SGML sean muy
costosas.
Muy utilizado Solo en sectores muy específicos
Compatibilidad e integración con HTML No compatibilidad con HTML definida.
Formateos y estilo fáciles de aplicar Formateo y estilo complejos.
No usa etiquetas opcionales
Para trabajar en XML es necesario editar los documentos y luego procesarlos, por tanto,
tenemos dos tipos de herramientas:
Editores XML Los ML se basan en la utilización de ficheros de texto plano por lo que basta
utilizar un procesador de texto normal para construir un documento XML.
+Para crear documentos XML complejos editor XML. Estos nos ayudan a crear estructuras y
etiquetas de los elementos usados en los documentos, además algunos incluyen ayuda para la
creación de otros elementos como DTD, hojas de estilo CSS o XSL, ... El W3C ha desarrollado un
editor de HTML, XHTML, CSS y XML gratuito cuyo nombre es Amaya.
Procesadores XML Para interpretar el código XML se puede utilizar cualquier navegador.
Los procesadores de XML permiten leer los documentos XML y acceder a su contenido y
estructura.
+Por tanto, para crear documentos XML es necesario: bastaría un blog de notas y un
navegador
Dado que XML se concibió para trabajar en la Web, es directamente compatible con
protocolos que ya funcionan, como HTTP y los URL.
Todo documento que verifique las reglas de XML está conforme con SGML.
No se requieren conocimientos de programación para realizar tareas sencillas en XML.
Los documentos XML son fáciles de crear.
La difusión de los documentos XML está asegurada ya que cualquier procesador de
XML puede leer un documento de XML.
El marcado de XML es legible para los humanos.
El diseño XML es formal y conciso.
XML es extensible, adaptable y aplicable a una gran variedad de situaciones.
XML es orientado a objetos.
Todo documento XML se compone exclusivamente de datos de marcado y datos
carácter entremezclados.
1. Especificación de requisitos.
2. Diseño de etiquetas.
3. Marcado de los documentos.
El marcado en XML son etiquetas que se añaden a un texto para estructurar el contenido del
documento. Esta información extra permite a los ordenadores "interpretar" los textos. El
marcado es todo lo que se sitúa entre los caracteres "<" y ">" o "&" y ";"
Los datos carácter son los que forman la verdadera información del documento XML.
El marcado puede ser tan rico como se quiera. Puede ser interesante detectar necesidades
futuras y crear documentos con una estructura fácilmente actualizables.
Comentarios Los documentos XML pueden tener comentarios, que no son interpretados
por el interprete XML. Estos se incluyen entre las cadenas "<!-" y "-->", pueden estar en
cualquier posición en el documento salvo:
Los documentos XML pueden estar formados por una parte opcional llamada prólogo y otra
parte obligatoria llamada ejemplar.
La declaración XML: En el caso de incluirse ha de ser la primera línea del documento, de no ser
así se genera un error que impide que el documento sea procesado.
Funciones:
La parte más importante, contiene los datos reales del documento. Formados por elementos
anidados.
Los elementos son los distintos bloques de información que permiten definir la estructura de
un documento XML. Está, delimitados por una etiqueta de apertura y una etiqueta de cierre. A
su vez los elementos pueden estar formados por otros elementos y/o por atributos.
Reglas:
Al anidar elementosNO puede cerrarse un elemento que contenga algún otro elemento
que aún no se haya cerrado.
3-Los nombres de las etiquetas de inicio y de cierre de un mismo elemento han de ser
IDÉNTICOS, respetando las mayúsculas y minúsculas.
Pueden ser cualquier cadena alfanumérica que no contenga espacios y no comience ni por
":", ni por la cadena "xml" ni ninguna de sus versiones ("XML", "XmL", "xML",...).
NO SE PUEDE USAR:
[Link]
5.2.1.- Atributos.
Vemos que los elementos aparecen coloreados en ciruela, los nombres de los atributos en
negro y sus valores en azul.
Los atributos se definen y dan valor dentro de una etiqueta de inicio o de elemento vacio, a
continuación del nombre del elemento o de la definición de otro atributo siempre separado
de ellos por un espacio. Los valores del atributo van precedidos de un igual que sigue al
nombre del mismo y tienen que definirse entre comillas simples o dobles.
Los nombres de los atributos han de cumplir las mismas reglas que los de los elementos, y no
pueden contener el carácter menor que, <.
BUSCAR ERROES
<?XML version="1.0" encoding="UTF-8" standalone="yes" ?> El prólogo debe empezar
por xml (minúscula) CORRECTO
<biblioteca>
<fecha_devol/> CORRECTO
</prestado>
</ejemplar>
</biblioteca>
o El prólogo debe empezar por xml (minúscula)
o El código de caracteres en este caso UTF-8 es adecuado; también podría ser otro.
o Los valores de los atributos pueden estar entre comillas dobles o simples
Todos los documentos XML deben verificar las reglas sintácticas que define la recomendación
del W3C para el estándar XML. Esas normas básicas son:
Varios documentos XML se pueden combinar entre sí, pudiendo en estos casos coincidir el
nombre de algunos elementos.
En el documento, las etiquetas ambiguas se sustituyen por otras en las que el nombre del
elemento está precedido de un prefijo, que determina el contexto al que pertenece la
etiqueta, seguido de dos puntos, :. Esto es:
<prefijo:nombre_etiqueta></prefijo:nombre_etiqueta>
Esta etiqueta se denomina "nombre cualificado". Al definir el prefijo hay que tener en cuenta
que no se pueden utilizar espacios ni caracteres espaciales y que no puede comenzar por un
digito.
Antes de poder utilizar un prefijo de un espacio de nombres, es necesario declarar el espacio de
nombres, es decir, asociar un índice con el URI asignado al espacio de nombres, mediante un
atributo especial xmlns. Esto se hace entre el prólogo y el ejemplar de un documento XML y su
sintaxis es la siguiente:
<conexion>://<direccionservidor>/<apartado1>/<apartado2>/...
EJEMPLO:
Sean los documentos XML que organizan la información sobre los profesores y los alumnos del
DAW respectivamente:
Al hacer un documento sobre los miembros del curso DAW no se distinguirían los profesores
de los alumnos, para resolverlo definiremos un espacio de nombres para cada contexto: