Estructura y marcado de texto en HTML
Estructura y marcado de texto en HTML
Texto
La mayor parte del contenido de las páginas HTML habituales está formado por texto, llegando
a ser más del 90% del código de la página. Por este motivo, es muy importante conocer los
elementos y etiquetas que define HTML para el manejo del texto.
El lenguaje HTML incorpora al tratamiento del texto muchas de las ideas y normas establecidas
en otros entornos de publicación de contenidos. De esta forma, HTML define etiquetas para
estructurar el contenido en secciones y párrafos y define otras etiquetas para marcar
elementos importantes dentro del texto.
La tarea inicial del editor de contenidos HTML consiste en estructurar el texto original definiendo
sus párrafos, titulares y títulos de sección, como se muestra en la siguiente imagen:
3.1. Estructurar
La forma más sencilla de estructurar un texto consiste en separarlo por párrafos. Además, HTML
permite incluir títulos que delimitan cada una de las secciones.
3.1.1. Párrafos
Una de las etiquetas más utilizadas de HTML es la etiqueta <p>, que permite definir los párrafos
que forman el texto de una página. Para delimitar el texto de un párrafo, se encierra ese texto
con la etiqueta <p>, como muestra el siguiente ejemplo:
<html>
<head>
<title>Ejemplo de texto estructurado con párrafos</title>
</head>
2
Aprendiendo el código HTML como si estuviera en primero
<body>
<p>Este es el texto que forma el primer párrafo de la página.
Los párrafos pueden ocupar varias líneas y el navegador se encarga
de ajustar su longitud al tamaño de la ventana.</p>
</html>
El ejemplo anterior se visualiza de la siguiente manera en cualquier navegador:
<p> Párrafos
Atributos comunes básicos, i18n y eventos
Atributos específicos -
3
Aprendiendo el código HTML como si estuviera en primero
Los párrafos creados con HTML son elementos de bloque, por lo que siempre ocupan toda la
anchura de la ventana del navegador. Además, no tienen atributos específicos, pero sí que se les
pueden asignar los atributos comunes de HTML básicos, de internacionalización y de eventos.
3.1.2. Secciones
Las páginas HTML habituales suelen tener una estructura más compleja que la que se puede
crear solamente mediante párrafos. De hecho, es habitual que las páginas se dividan en diferentes
secciones jerárquicas.
Los títulos de sección se utilizan para delimitar el comienzo de cada sección de la página. HTML
permite crear secciones de hasta seis niveles de importancia. De esta forma, aunque una página
puede definir cualquier número de secciones, sólo puede incluir seis niveles jerárquicos.
Las etiquetas que definen los títulos de sección son <h1>, <h2>, <h3>, <h4>, <h5> y <h6>. La etiqueta
<h1> es la de mayor importancia y por tanto se utiliza para definir los titulares de la página. La
importancia del resto de etiquetas es descendiente, de forma que la etiqueta <h6> es la que se
utiliza para delimitar las secciones menos importantes de la página.
A continuación se muestra la definición formal de la etiqueta <h1>, siendo idéntica la definición
del resto de etiquetas referidas a los títulos de sección:
Atributos específicos -
Al igual que la etiqueta <p>, las etiquetas de título de sección son elementos de bloque y no tienen
atributos específicos.
Las etiquetas <h1>, ..., <h6> definen títulos de sección, no secciones completas. Por este motivo,
no es necesario encerrar los contenidos de una sección con su etiqueta correspondiente.
Solamente se debe encerrar con las etiquetas <h1>, ..., <h6> los títulos de cada sección.
El siguiente ejemplo muestra el uso de las etiquetas de título de sección:
<html>
4
Aprendiendo el código HTML como si estuviera en primero
<head>
<title>Ejemplo de texto estructurado con secciones</title>
</head>
<body>
<h1>Titular de la página</h1>
<p>Párrafo de introducción...</p>
<p>Párrafo de contenido...</p>
<h2>Otra subsección</h2>
</html>
Los navegadores muestran el ejemplo anterior de la siguiente manera:
5
Aprendiendo el código HTML como si estuviera en primero
Evidentemente, el aspecto que los navegadores aplican por defecto a los títulos de sección se
puede modificar utilizando las hojas de estilos de CSS. La siguiente imagen muestra el tamaño
por defecto con el que los navegadores muestran cada titular:
Figura 3.5. Ejemplo de uso de las etiquetas h1, h2, h3, h4, h5 y h6
<em> Énfasis
Atributos comunes básicos, i18n y eventos
Atributos específicos -
Tipo de elemento En línea
Descripción Realza la importancia del texto que encierra
<strong> Énfasis más acentuado
Atributos comunes básicos, i18n y eventos
Atributos específicos -
Tipo de elemento En línea
Descripción Realza con la máxima importancia el texto que encierra
6
Aprendiendo el código HTML como si estuviera en primero
La etiqueta <em> marca un texto indicando que su importancia es mayor que la del resto del
texto. La etiqueta <strong> indica que un determinado texto es de la mayor importancia dentro
de la página. Ejemplo:
<html>
<head>
<title>Ejemplo de etiqueta em y strong</title>
</head>
<body>
<p>El lenguaje HTML permite marcar algunos segmentos de texto
como <em>muy importantes</em> y otros segmentos como <strong>los
más importantes</strong>.</p>
</body>
</html>
Por defecto, los navegadores muestran los elementos <em> en cursiva para hacer evidente su
importancia y muestran los elementos <strong> en negrita, para indicar que son los más
importantes:
7
Aprendiendo el código HTML como si estuviera en primero
Figura 3.7. Resultado de estructurar y marcar el texto original
HTML también permite marcar de forma adecuada las modificaciones realizadas en el contenido
de una página. En otras palabras, HTML permite indicar de forma clara el texto que ha sido
eliminado y el texto que ha sido añadido a un determinado texto original. Las etiquetas utilizadas
son <ins> y <del>, cuya definición formal es la siguiente:
<ins> Inserción
Atributos
básicos, i18n y eventos
comunes
8
Aprendiendo el código HTML como si estuviera en primero
<ins> Inserción
cite = "url" - Indica la URL de la página en la que se puede obtener más
Atributos información sobre el motivo por el que se realizó la modificación.
datetime = "fecha" - Especifica la fecha y hora en la que se realizó el
específicos
cambio
Tipo de
Bloque y en línea
elemento
Se emplea para marcar una modificación en los contenidos originales
Descripción
consistente en la inserción de un nuevo contenido
<del> Borrado
Atributos
básicos, i18n y eventos
comunes
cite = "url" - Indica la URL de la página en la que se puede obtener más
Atributos información sobre el motivo por el que se realizó la modificación.
datetime = "fecha" - Especifica la fecha y hora en la que se realizó el
específicos
cambio
Tipo de
Bloque y en línea
elemento
Se emplea para marcar una modificación en los contenidos originales
Descripción
consistente en el borrado de cierto contenido
Las dos etiquetas cuentan con los mismos atributos específicos, que opcionalmente se pueden
añadir para proporcionar más información sobre los cambios realizados. El atributo cite se emplea
para indicar la dirección de un documento externo en el que se puede encontrar más
información relacionada con la inserción o el borrado de texto. El atributo datetime puede utilizarse
para indicar la fecha y la hora en la que se realizó cada cambio.
Ejemplo:
<html>
<head><title>Ejemplo de etiqueta ins y del</title></head>
<body>
9
Aprendiendo el código HTML como si estuviera en primero
marcas hipertextuales</ins>) es un lenguaje de marcación diseñado para estructurar textos y
presentarlos en forma de hipertexto.</p>
</body>
</html>
<blockquote> Citas
Atributos comunes básicos, i18n y eventos
cite = "url" - Indica la dirección de la página web original de la que
Atributos
se extrae la cita
específicos
Tipo de elemento Bloque
Se emplea para indicar que el texto que encierra es una cita textual de otro
Descripción
texto externo
Al igual que <ins> y <del>, la etiqueta <blockquote> permite indicar mediante el atributo cite la
10
Aprendiendo el código HTML como si estuviera en primero
dirección de un documento del que se ha extraído la cita. Ejemplo:
<html>
<head><title>Ejemplo de etiqueta blockquote</title></head>
<body>
<p>Según el W3C, el valor del
atributo <em>cite</em> en las etiquetas <strong>blockquote</strong> tiene el
siguiente significado:</p>
</html>
11
Aprendiendo el código HTML como si estuviera en primero
<abbr> Abreviaturas
Atributos
básicos, i18n y eventos
comunes
Atributos title = "texto" - Indica el significado completo de la abreviatura
específicos
Tipo de elemento En línea
Se emplea para marcar las abreviaturas del texto y proporcionar el
Descripción
significado de esas abreviaturas
<acronym> Acrónimos o siglas
Atributos
básicos, i18n y eventos
comunes
Atributos title = "texto" - Indica el significado completo del acrónimo o sigla
específicos
Tipo de elemento En línea
Se emplea para marcar las siglas o acrónimos del texto y proporcionar el
Descripción
significado de esas siglas
En ambos casos, el atributo title se puede utilizar para incluir el significado completo de la
abreviatura o sigla. Ejemplo:
<html>
<head>
<title>Ejemplo de etiqueta acronym</title>
</head>
<body>
<p>El lenguaje <acronym title="HyperText Markup Language">HTML</acronym> es estandarizado
por el <acronym title="World Wide Web Consortium">W3C</acronym>.</p>
</body>
</html>
La mayoría de navegadores muestran por defecto un borde inferior punteado para todos los
elementos <abbr> y <acronym>. Al posicionar el puntero del ratón sobre la palabra subrayada, el
navegador muestra un pequeño recuadro (llamado tooltip en inglés) con el valor del atributo title:
12
Aprendiendo el código HTML como si estuviera en primero
Figura 3.10. Ejemplo de uso de la etiqueta acronym
Por otra parte, en ocasiones resulta útil incluir la definición de una palabra extraña o cuyo uso
está restringido a un entorno muy determinado. HTML incluye la etiqueta <dfn> para
proporcionar al usuario la definición de todas las palabras para las que se considere apropiado.
La definición formal de esta etiqueta se muestra a continuación:
<dfn> Definición
Atributos
básicos, i18n y eventos
comunes
Atributos title = "texto" - Indica el significado completo del término
específicos
Tipo de elemento En línea
Se emplea para marcar las definiciones de ciertos términos y proporcionar
Descripción
el significado de esos términos
El siguiente ejemplo muestra cómo se utiliza la etiqueta <dfn> para incluir la definición completa
de una palabra cuyo uso no es habitual fuera de los ámbitos médicos y psicológicos:
<p>Con estos síntomas, podría tratarse de un caso de <dfn title="Imagen o sensación subjetiva,
propia de un sentido, determinada por otra sensación que afecta a un sentido
diferente">sinestesia</dfn></p>
Por último, HTML incluye una etiqueta que se puede utilizar para marcar un texto como una
citación:
<cite> Cita
13
Aprendiendo el código HTML como si estuviera en primero
<cite> Cita
Atributos comunes básicos, i18n y eventos
Atributos específicos -
Tipo de elemento En línea
Descripción Se emplea para marcar una cita o una referencia a otras fuentes
En ocasiones, no está clara la diferencia entre <cite> y <blockquote>. El elemento <cite> marca el autor
de la cita (persona, documento, etc.) y <blockquote> marca el contenido de la propia cita. En el
siguiente ejemplo, <blockquote> encierra el contenido de una frase célebre y <cite> encierra el
nombre de su autor:
Como dijo <cite>Mahatma Gandhi</cite>:
<blockquote>Vive como si fueras a morir mañana y aprende como si fueras a vivir para siempre.</blockquote>
Ejercicio 3
Estructurar y marcar el siguiente texto para que el navegador lo muestre con el aspecto de la
siguiente imagen:
14
Aprendiendo el código HTML como si estuviera en primero
Figura 3.11. Texto HTML correctamente estructurado y marcado
15.3. Ejercicio 3
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" lang="es" xml:lang="es">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1" />
<title>El Ártico ha perdido el 14% de su hielo marino perenne en un solo año</title>
</head>
<body>
<blockquote><em>"Los cambios registrados en esos años en el hielo ártico son rápidos y espectaculares. De
mantenerse la situación, ésta tendrá un impacto profundo en el ambiente, así como en el transporte marino y
el comercio."</em></blockquote>
</body>
</html>
15
Aprendiendo el código HTML como si estuviera en primero
El texto del ejemplo anterior contiene elementos de texto importantes, siglas, números de
teléfono y direcciones de correo electrónico. XHTML define la etiqueta <strong> para marcar los
elementos importantes y <acronym> para marcar las siglas:
<strong>Importante</strong>: si quiere ponerse en contacto con la empresa <acronym>ACME</acronym>,
puede hacerlo en el teléfono 900 555 555 o a través de la dirección de correo electrónico
[email protected]
La etiqueta <span> se visualiza por defecto con el mismo aspecto que el texto normal. Por tanto es
habitual utilizar esta etiqueta junto con los atributos id y class para modificar posteriormente su
aspecto con CSS:
<strong>Importante</strong>: si quiere ponerse en contacto con la empresa <acronym>ACME</acronym>,
puede hacerlo en el teléfono <span class="telefono">900 555 555</span> o a través de la dirección de
correo electrónico <span class="email">[email protected]</span>
La etiqueta <span> sólo se puede utilizar para encerrar contenidos y etiquetas en línea. Cuando se
quieren estructurar elementos de bloque, se utiliza la etiqueta <div>, tal y como se verá en
capítulos posteriores.
16
Aprendiendo el código HTML como si estuviera en primero
<head><title>Ejemplo de etiqueta p</title></head>
<body>
<p>Este primer párrafo no contiene saltos de línea ni otro tipo de espaciado.</p>
17
Aprendiendo el código HTML como si estuviera en primero
3.5.1. Nuevas líneas
Para incluir una nueva línea en un punto y forzar a que el texto que sigue se muestre en la línea
inferior, se utiliza la etiqueta <br>. En cierta manera, insertar la etiqueta <br> en un determinado
punto del texto equivale a presionar la tecla ENTER (o Intro) en ese mismo punto.
La definición formal de <br> se muestra a continuación:
Atributos específicos -
La etiqueta <br> es una de las pocas etiquetas especiales de HTML. La particularidad de <br> es
que es una etiqueta vacía, es decir, no encierra ningún texto. De esta forma, la etiqueta debe
abrirse y cerrarse de forma consecutiva: <br></br>.
En estos casos, HTML permite utilizar un atajo para indicar que una etiqueta se está abriendo y
cerrando de forma consecutiva: <br/> (también se puede escribir como <br />).
Utilizando la etiqueta <br> se puede rehacer el ejemplo anterior para que respete las líneas que
forman el segundo párrafo:
<html>
<head>
<title>Ejemplo de etiqueta br</title>
</head>
<body>
<p>Este primer párrafo no contiene saltos de línea ni otro tipo de espaciado.</p>
18
Aprendiendo el código HTML como si estuviera en primero
</html>
El navegador ahora sí que muestra correctamente las nuevas líneas que se querían insertar:
<head>
<title>Ejemplo de entidad </title>
</head>
<body>
<p>Este primer párrafo no contiene saltos de línea ni otro tipo de espaciado.</p>
19
Aprendiendo el código HTML como si estuviera en primero
</html>
Ahora el navegador sí que muestra correctamente los espacios en blanco (y las nuevas líneas) del
segundo párrafo:
Más adelante se profundiza en el origen de y se comprenderá por qué es necesario incluir
esa sucesión tan extraña de caracteres cada vez que se quiere incluir un espacio en blanco
adicional.
Ejercicio 4
Determinar el código HTML que corresponde al siguiente documento:
20
Aprendiendo el código HTML como si estuviera en primero
Figura 3.15. Texto HTML con espacios en blanco y nuevas líneas
Atributos
-
específicos
Muestra el texto que encierra tal y como está escrito (respetando los espacios en
Descripción
blanco)
21
Aprendiendo el código HTML como si estuviera en primero
El siguiente ejemplo muestra el uso de la etiqueta <pre>:
<html>
<head><title>Ejemplo de etiqueta pre</title></head>
<body>
<pre>
La etiqueta pre respeta los espacios en blanco y muestra el texto tal y como está escrito
</pre>
<p>
La etiqueta pre respeta los espacios en blanco y muestra el texto tal y como está escrito
</p>
</body>
</html>
El ejemplo anterior incluye el mismo texto (con espacios en blanco y varias líneas) dentro de una
etiqueta <pre> y dentro de una etiqueta <p>. Las diferencias visuales en un navegador son muy
evidentes:
22
Aprendiendo el código HTML como si estuviera en primero
ha eliminado todos los espacios en blanco sobrantes. Los elementos <pre> son especiales, ya que
los navegadores les aplican las siguientes reglas:
Mantienen todos los espacios en blanco (tabuladores, espacios y nuevas líneas)
Muestra el texto con un tipo de letra especial, denominado "de ancho fijo", ya que todas sus letras
son de la misma anchura
No se ajusta la longitud de las líneas (las líneas largas producen un scroll horizontal en la ventana del
navegador)
Esta última característica diferencia por completo a los párrafos de los elementos <pre>. Como se
ha visto, los navegadores ajustan la anchura de los párrafos de texto para que ocupen todo el
tamaño de la ventana. Sin embargo, los elementos <pre> se muestran tal y como son
originalmente, por lo que una línea muy larga dentro de un elemento <pre> provoca que la
anchura de la página sea superior a la anchura de la ventana del navegador.
Si en el ejemplo anterior se añade más texto al final de la segunda línea (para producir una línea
larga), el navegador muestra un scroll horizontal ya que el texto completo no cabe en el tamaño
de la ventana y las líneas de los elementos <pre> nunca se ajustan.
Atributos específicos -
23
Aprendiendo el código HTML como si estuviera en primero
<code> Código fuente
Tipo de elemento En línea
En la mayoría de páginas web, no tiene sentido utilizar la etiqueta <code>. Sin embargo, en
muchas páginas web técnicas que incluyen listados de programas, trozos de código o etiquetas
HTML, lo correcto es emplear la etiqueta <code>.
Ejemplo:
La etiqueta code
no respeta lo<html>
<head><title>Ejemplo de etiqueta code</title></head>
<body>
<code>
La etiqueta sin espacios en blanco
</code>
</body>
</html>
El navegador muestra claramente el comportamiento de <code> y sus diferencias con <pre>:
24
Aprendiendo el código HTML como si estuviera en primero
Figura 3.18. Ejemplo de uso de la etiqueta code
Al igual que sucede con los elementos <pre>, el texto encerrado por la etiqueta <code> se muestra
con un tipo de letra especial de ancho fijo. Por el contrario, el elemento <code> no respeta los
espacios en blanco ni las líneas, por lo que su comportamiento es similar a la etiqueta <p>. La
última diferencia es que <code> es un elemento en línea, mientras que <pre> es un elemento de
bloque.
25
Aprendiendo el código HTML como si estuviera en primero
(espacio en blanco) non-breaking space espacio en blanco
' ' apostrophe apóstrofo
Para mostrar correctamente el texto anterior en una página HTML, se debe sustituir cada
carácter especial por su entidad HTML:
<p>Los caracteres <, >, " y & pueden dar problemas con los textos en
HTML</p>
Ejercicio 5
Determinar el código HTML que corresponde al siguiente documento:
26
Aprendiendo el código HTML como si estuviera en primero
El servidor web almacena las páginas HTML estáticas o el código de la aplicación web y
sirve las páginas solicitadas por los usuarios.
El usuario solicita y visualiza las páginas web a través de su navegador.
Si en todos los procesos anteriores se utiliza la misma codificación de caracteres, los caracteres
propios de los idiomas se pueden escribir directamente:
<p>Este párrafo contiene caracteres acentuados y se almacena en formato UTF-8</p>
La palabra párrafo del ejemplo anterior incluye la letra á. Si el editor HTML del diseñador utiliza la
codificación UTF-8, el entorno de desarrollo del programador también utiliza UTF-8, el servidor
web sirve las páginas con esa codificación y el navegador del usuario es capaz de visualizar las
páginas con formato UTF-8, el texto anterior se verá correctamente en el navegador del
usuario.
Sin embargo, muchas veces no es posible que todos los procesos involucrados utilicen la misma
codificación de caracteres. Por limitaciones técnicas o por decisiones de los diseñadores y
programadores, los textos pueden pasar de codificación UTF-8 a codificación ISO-8859 en
cualquier momento. Si se produce este cambio sin realizar una conversión correcta, el navegador
del usuario mostrará caracteres extraños en todos los acentos y en todas las letras como la ñ.
La solución más sencilla para asegurar que todos estos caracteres potencialmente problemáticos
se van a visualizar correctamente en el navegador del usuario consiste en sustituir cada carácter
problemático por su entidad HTML:
27
Aprendiendo el código HTML como si estuviera en primero
Así, el párrafo de texto del ejemplo anterior, se podría escribir de la siguiente manera:
<p>Este párrafo contiene caracteres acentuados y se almacena en formato UTF-8</p>
Si se utilizan las entidades HTML en vez de los caracteres problemáticos, es indiferente pasar de
una codificación de caracteres a otra diferente. En la Wikipedia se puede consultar
28
Aprendiendo el código HTML como si estuviera en primero