03 CodificacionInformacion
03 CodificacionInformacion
Codificación de la información
Ya sabemos manejarnos con los sistemas de numeración más utilizados en informática, ahora
vamos a ver como se agrupan una secuencia de bits para representar un determinado tipo de
datos (numéricos, alfanuméricos, de control de transmisión, etc).
Hasta ahora hemos hablado de números enteros y fraccionarios en distintos sistemas de nume-
ración, pero no lo hemos hecho de los números negativos. Al considerar los negativos unifi-
camos las operaciones de adición y sustracción, dado que la resta no es más que la suma cam-
biando el signo del segundo sumando (minuendo): A - B = A + (-B)
Para indicar que un número es negativo añadimos el símbolo ‘-‘. Pero el ordenador sólo traba-
ja con 0 y 1, por tanto tendremos que pensar en como indicarle al ordenador que un número es
negativo. Todos los sistemas de codificación de números definen como deben representarse
los números positivos y negativos, los números enteros y los fraccionarios.
Dependiendo del tipo de número que se quiera representar, las operaciones aritméticas que se
efectúen y el rango a representar nos podemos encontrar con los siguientes tipos o códigos de
representación numérica:
En este sistema de codificación el bit situado más a la izquierda representa el Signo, y su va-
lor será: 0 para los números positivos (+)
1 para los negativos (-)
El resto de los bits (N-1) representan el Módulo del número. Este vendrá dado por su corres-
pondiente valor binario.
(- 2 N-1 + 1) a (+ 2 N-1 - 1)
1.1.2. Complemento a 1.
0 0 0 0 1 0 1 0 10
+ 1 1 1 1 1 1 0 0 + (-3)
acarreo 1 0 0 0 0 0 1 1 0
+ 1 acarreo
0 0 0 0 0 1 1 1 7
1 1 1 1 1 1 0 0 (-3)
+ 0 0 0 0 1 0 1 0 + 10
acarreo 1 0 0 0 0 0 1 1 0
+ 1 acarreo
0 0 0 0 0 1 1 1 7
Ejemplo: Desbordamiento
0 1 1 1 1 1 1 1 127
+ 0 0 0 0 0 0 1 1 + 3
Signo<>operados 1 0 0 0 0 0 1 0 overflow
1 0 0 0 0 0 0 0 (-127)
+ 1 1 1 1 1 1 0 0 + (-3)
Acarreo y Signo<>operados 1 0 1 1 1 1 1 0 0 overflow
1.1.3. Complemento a 2.
Ventaja Importante el cero tiene una única representación. Veámosla para 8 bits:
Número 0 0 0 0 0 0 0 0 0
Número -0 Primer paso: 11111111
Segundo paso: 11111111
Tercer paso + 1
1 00000000 Se desprecia el 1 acarreo
Por esta razón, el rango de representación de este método es asimétrico, y como la represen-
tación del cero la tomamos de los positivos, estos tendrán un número menos:
-2N-1 a +2N-1 - 1
0 0 0 0 1 0 1 0 10
+ 1 1 1 1 1 1 0 1 + (-3)
El acarreo 1 0 0 0 0 0 1 1 1 7
se desprecia
En este sistema de codificación de los números enteros se resuelve el problema de tener dos
configuraciones distintas para el cero de la siguiente forma:
De todas las combinaciones posibles con N bits (2N nos daría todas las combinaciones
posibles con N bits y se corresponden con los valores absolutos –sin signo-) se selecciona
como valor cero el valor situado en la mitad de la lista. Para elegir la combinación bina-
ria que representará el valor cero nos podemos encontrar con dos implementaciones dis-
tintas según si se desea que el cero forme parte de los números positivos o por el contrario,
formen parte de los negativos, siendo el rango de representación distinto en cada caso. Por
otro lado tenemos que el valor de esta combinación binaria del cero representa el valor de
exceso o desplazado necesario para calcular la combinación binaria de los números con
signo que deseemos representar.
Los números negativos se corresponderán con todas aquellas combinaciones binarias infe-
riores a la combinación binaria que representa el cero.
los números positivos se corresponderán con todas aquellas combinaciones binarias supe-
riores a la combinación binaria que representa el cero.
Así pues, en este sistema de codificación y a diferencia con los sistemas vistos anterior-
mente, vamos a observar que los números negativos empezaran por 0 y los positivos por 1.
Para terminar de entender este sistema de codificación lo mejor es verlo con un ejemplo sen-
cillo, para ello utilizaremos N=3 bits.:
Con tres bits tenemos 8 combinaciones binarias posibles 23 cuyos valores absolutos (sin
signo) irían de 0 a 7:
Combinaciones Valor absoluto Valor codificado
binarias (sin signo) (con signo)
000 0 -3
001 1 -2
010 2 -1
011 3 0
100 4 +1
101 5 +2
110 6 +3
111 7 +4
Para calcular el valor absoluto correspondiente al valor de "exceso" o "desplazado" y
que se corresponderá con el valor codificado cero, en este caso, hemos utilizamos la
fórmula 23-1 -1 (esto es, 22 -1 = 4 -1 = 3). En este caso, por tanto, el cero formaría parte
de los números negativos (su combinación binaria empieza por cero). Este será el criterio
que utilizaremos en estos ejercicios y que también utilizaremos en la codificación del ex-
ponente en la codificación de coma flotante según el estándar IEEE754. Así pues, en este
caso, el rango de representación sería:
El procedimiento para codificar en exceso a 2N-1 -1 una cantidad en decimal con signo
seguiremos los siguientes pasos:
1º. Calcular el valor del exceso (sesgo o desplazado) correspondiente a N bits mediante la
fórmula 2N-1 -1
2º. Calcular el valor absoluto en decimal sumando al valor de exceso el valor decimal
con su signo:
(Valor exceso) + (valor decimal con su signo) = Valor absoluto en decimal
Para representar los dígitos decimales (0 –9) según una secuencia binaria han existido y exis-
ten distintos sistemas de codificación. Entre otros mencionaremos a: BCD, Aiken, código
5421, Jhonson y Gray.
Algunos de ellos tienen una particularidad especial (distancia Hamming 1, códigos progresi-
vos). Por otro lado, otros sistemas de codificación se basan en BCD, tales como Decimal
Empaquetado y Decimal Desempaquetado.
AIKEN
Decimal BCD 5421 JHONSON GRAY
2421
0 0000 0000 0000 00000 0000
1 0001 0001 0001 00001 0001
2 0010 0010 0010 00011 0011
3 0011 0011 0011 00111 0010
4 0100 0100 0100 01111 0110
5 0101 1011 1000 11111 0111
6 0110 1100 1001 11110 0101
7 0111 1101 1010 11100 0100
8 1000 1110 1011 11000 1100
9 1001 1111 1100 10000 1101
En BCD cada dígito decimal se representa por 4 bits o dígitos binarios (cuarteto o nibble)
obtenidos de su conversión al binario según el TFN.
Los otros códigos representan los dígitos decimales siguiendo una combinación diferente en
cada caso.
En el caso de los códigos 5421 y AIKEN podemos observar que ambos códigos tienen un
inconveniente importante y es que algunos de los dígitos decimales admiten más de una com-
binación diferente, (ej. C. Aiken 6=1100 o 0110; c. 5421, 6=1001 o 0110) aunque en realidad
la ambigüedad se salva especificando que los primeros 5 dígitos (0-4) empiezan por 0, y los 5
siguientes (5-9) por 1.
Por otro lado, los códigos Jhonson y Gray tienen la particularidad de tener una distancia
Hamming 1 y tratarse de códigos progresivos.
Distancia de Hamming. Es el número de dígitos en que difieren dos palabras de código.
Códigos progresivos. Son códigos en los que las combinaciones correspondientes a números
decimales consecutivos son adyacentes, es decir, se diferencian sólo en un bit (distancia
Hamming = 1).
Códigos progresivos cíclicos. Son códigos progresivos en los que la última combinación es
adyacente a la primera. Ejemplos de este tipo de codificaciones es el Jhonson (cuando repre-
senta únicamente los dígitos decimales, tal como vemos en tabla) y el código Gray (cuando
generamos todas las combinaciones posibles con N bits, en la tabla sólo tenemos la corres-
pondencia con los dígitos decimales y no podemos observar esta característica.
El código GRAY debido a estas particularidades es un código muy utilizado en dispositivos
mecánicos, en los ADC (conversores de digital a binario) y en robótica. El error medio en la
transmisión es menor cuando se hace uso del código Gray. Vamos a ver a continuación como
se generan la secuencia binaria en el códigos Gray.
Algoritmo del código Gray:
El código Gray de 1 bits (N=1) es 0, 1
El código Gray de N bits es:
Un código Gray de N-1 bits antecedidos de un 0, seguido de,
Un código Gray de N-1 bits escritos en orden inverso, antecedidos de un 1.
Ejemplos:
Códigos GRAY
N=1 N=2 N=3
0 00 000
1 01 001
11 011
10 010
110
111
101
100
A. Decimal desempaquetado
En este sistema un número se almacena en un byte por cada una de sus cifras. Cada byte lleva
en su cuarteto de la izquierda cuatro unos (F en hexadecimal) denominados bits de zona, y en
el de la derecha la cifra en BCD (decimal codificado en binario) denominados bits de dígito.
El cuarteto de la izquierda de la última cifra representa el signo, conteniendo 1100 para el + y
1101 para el - (C y D en hexadecimal respectivamente).
1992: signo +
-1992: signo -
B. Decimal Empaquetado
Se representa cada dígito en un cuarteto (sin bits de zona), salvo el primero por la derecha que
lleva el signo con los mismos valores (1100 para el + y 1101 para el -).
.... + 1100 C
- 1101 D
Digito BCD Digito BCD Digito BCD SIGNO
1992: signo +
La coma flotante surge de la necesidad de representar números reales con un rango de repre-
sentación mayor al que nos ofrece la representación en coma fija y posibilitar a la computado-
ra el tratamiento de números muy grandes y muy pequeños.
Nº = MANTISA * BASEEXPONENTE
Un número en esta notación tiene infinitas representaciones, de las que se toma la denomina-
da exponencial normalizada, que consiste en que la mantisa no tiene parte entera y el primer
dígito a la derecha de la coma es significativo (distinto de cero), salvo en la representación del
número 0. El exponente indica donde se sitúa la coma decimal, por eso se habla de coma flo-
tante.
Ejemplos:
-MinMantisa*B-MaxExp +MinMantisa*B-MaxExp
-MaxMantisa*B+MaxExp +MaxMantisa*B+MaxExp
0
campo está normalizado, pero como en binario la primera cifra significativa siempre
será un 1, en lugar de tomar "0," como punto de partida, se toma "1," de forma que se
ahorra el almacenamiento de un bit el cual estará oculto (esta técnica en la que el 1, está
implícito en la codificación se denomina de "bit fantasma". La mantisa está codificada
en Módulo y Signo, así que tendremos dos configuraciones para el cero.
Utiliza 4 bytes (32 bits) para la representación de los números reales. El primer bit de la iz-
quierda representará el signo (que será 0 para +, 1 para -); a continuación, 8 bits para el ex-
ponente, y finalmente 23 bits para el significando o mantisa (BM, Bits Mantisa):
Si la operación es suma y los signos son iguales, o si la operación es resta y los signos son
diferentes, sumar las mantisas. En otro caso restarlas.
Detectar overflow de la mantisa.
Normalizar la mantisa, desplazándola a la derecha o a la izquierda hasta que el dígito más
significativo esté delante de la coma decimal.
Redondear el resultado y renormalizar la mantisa si es necesario.
Corregir el exponente en función de los desplazamientos realizados sobre la mantisa.
Detectar overflow o underflow del exponente.
2.1. INTRODUCCIÓN.
Utilizando únicamente ceros y unos, hemos visto como podemos representar en el ordenador
información numérica con la que el ordenador (el microprocesador) es capaz de operar con
ellos (hacer cálculos aritméticos). Sin embargo, también necesitamos representar otra serie de
símbolos (letras mayúsculas y minúsculas; caracteres de puntuación; etc).
Para ello se utilizan los códigos alfanuméricos que, básicamente, se trata de tablas que con-
tienen el conjunto de caracteres que necesitamos representar y a los que se les hace corres-
ponder una combinación de bits siguiendo algún criterio. Esta relación carácter-bits debe ser
unívoca, de forma que no haya ambigüedades. Así pues, los códigos alfanuméricos permiten
traducir la información o los datos que nosotros entendemos a una representación que la
máquina puede interpretar y procesar. Los fabricante de componentes de E/S podrían asignar
una combinación diferente a un mismo carácter o símbolo de origen; sin embargo, esto no
sería nada positivo en un mercado como el informático. Por eso se tiende a la estandarización
de códigos, que ha llevado a la universalización de unos pocos códigos de E/S, como el
EBCDIC, ASCII y Unicode. Antes de seguir aclararemos algunos términos o definiciones:
Carácter.
Componente más pequeño de un lenguaje escrito y que además posee un valor semántico
(nota: la semántica estudia el significado de los signos lingüísticos). Ejemplos: “1”, “.”,
“A” “纯”.
Conjunto de caracteres.
Es un grupo de caracteres sin ningún valor numérico asociado. Ejemplos: el alfabeto Es-
pañol o el Cirílico (usado en Rusia y Bulgaria).
Codificación de caracteres. (Character encoding)
Procedimiento por el que asociamos un determinado carácter o símbolo con un valor es-
calar (número) concreto. En este contexto, a dichos números se les denomina código (en
Unicode reciben el nombre de Punto de Código – Code Point- ) y deben ser:
o Números enteros
o No negativos
o Estar dentro de un conjunto finito.
Conjunto de caracteres codificados.
Es un grupo de caracteres asociados a un valor escalar. Ejemplo: la letra “A” mayúscula,
que según la tabla ASCII tiene el valor decimal 65 (hexadecimal 41, binario 0100 0001).
* | 0 1 2 3 4 5 6 7 8 9 A B C D E F
--------------------------------------------------------------
0 | NUL SOH STX ETX EOT ENQ ACK BEL BS TAB LF VT FF CR SO SI
1 | DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US
2 | ! " # $ % & ' ( ) * + , - . /
3 | 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4 | @ A B C D E F G H I J K L M N O
5 | P Q R S T U V W X Y Z [ \ ] ^ _
6 | ` a b c d e f g h i j k l m n o
7 | p q r s t u v w x y z { | } ~ DEL
- En esta 1ª versión de ASCII de 7 bits, se definieron 128 códigos (27) del 0 al 127. Estos
códigos han permanecido fijos en las sucesivas modificaciones posteriores del estándar.
- De los 8 bits que se transmitían, sólo se emplearon los de menor peso para establecer los
códigos y el de mayor peso se reservó para control de transmisión (paridad): Pxxx xxxx.
Por tanto, esos 128 códigos empiezan por cero en el actual código ASCII de 8 bits.
- El conjunto de caracteres codificado los dividieron en 4 grupos y sólo contenían los ca-
racteres alfabéticos y símbolos utilizados por los americanos
Grupo 1 (00-1F) Códigos de control, no imprimibles. El 00 es el código nulo.
Grupo 2 (20-3F) Signos especiales, de puntuación y dígitos numéricos. Notar que
el espacio en blanco es el 20 (32(10).
Los códigos de control tienen asignadas unas siglas que son las iniciales inglesas de la fun-
ción a que han sido atribuidas por el organismo de estandarización europeo CCITT (Comité
Consultivo Internacional de Telecomunicaciones y Telefonía). Algunos de estos caracteres
son:
ACK (Acknowledge) Acuse de recepción: Carácter de transmisión que es emitido por el dispositivo receptor para
indicar al emisor que los datos han sido bien recibidos.
BEL (Bell) Campana: Carácter utilizado cuando se tiene necesidad de llamar la atención del operador
del terminal.
NUL (Null) Nulo: Carácter nulo que puede estar incluido en un conjunto de caracteres y que puede ser
olvidado sin que la información sea efectuada.
SP (space) Espacio: Carácter blanco que no produce impresión. Se utiliza para separar textos.
VT (Vertical Tabulation) Tabulación vertical: Produce el que la cabez de impresión vuelva sobre el anterior carácter
impreso.
BS (BackSpace) Vuelta a posición anerior: Produce el que la cabeza de impresión vuelva sobre el anterior
carácter impreso.
CAN (Cancel) Cancelación: Los caracteres a los que va asociado no deben tomarse en cuenta.
CR (Carriage Return) Retorno de carro: El carro vueve a la primera posición de la línea.
LF (Line Feed) Salto de línea: El carro salta una línea, posicionandose el cursor al inicio de ella.
FF (Form Feed) Salto de primera línea: El carro salta una línea, posicionándose el cursor al inico de ella.
SYN (Synchronous Idle) Sincronización: Cáracter de sinronización, utilizado para que el receptor se ponga a la escu-
cha y sincronice su reloj.
STX (Start of Text) Principo de Texto: Precede a una secuencia de caractere, denominada texto y son datos.
ETX (End of Text) Fin de Texto: Finaliza un texto que va precedido por STX.
ENQ (Enquiry) Petición: petición de respuesta ala identificación de una estación o al estado.
EOT (End of Transmission) Fin de comunicación: Indica el fin de la transmisión de uno o varios textos.
ISO 646 Estandarización del US-ASCII de 7 bits. Dado que [Link]. fue el principal ven-
dedor de computadoras en todo el mundo en aquellos tiempos, el código US-
ASCII fue asumido por la mayoría de los fabricantes como el código estándar in-
ternacional (sólo IBM se resistió). Así pues, se hizo necesaria la adaptación de
dicho código a otros lenguajes provenientes del Latín, en particular los lenguajes
del Este de Europa. De este trabajo se encargo la International Organization for
Standardization (ISO) dando como resultado la Recomendación ISO 646 en
1967. Se trata de un código ASCII básico excepto en 10 posiciones de carácter
que se dejaron abiertas para las "variantes nacionales".
EBCDIC (Extended BCD for Information Communication), código empleado por IBM en
sus equipos (va por libre, es el líder del mercado). Lo estrena en sus sistemas
S/360 en 1964. La idea básica consistía en anteponer al BCD una zona de 4 bits
que se mantienen a 1111 para los dígitos decimales y toman combinaciones distin-
tas para el resto del alfabeto.
Con la llegada de los IBM-PC llegó también la necesidad de ampliar el conjunto de carac-
teres ASCII dado que los ordenadores se extendieron por todo el mundo y no todo el
mundo hablaba inglés.
Es importante adaptar los códigos a todas las lenguas, para que puedan utilizar sus pro-
pios caracteres.
El código ASCII-8 (o simplemente ASCII) se impone como estándar. Se utilizan los 8
bits para representar los códigos de caracteres obviando el bit de paridad.
La nueva normalización aparecen bajo las especificaciones ISO 8859. En ellas, los prime-
ros 128 códigos son los del US-ASCII/ISO 646, y los nuevos 128 códigos disponibles al
utilizar el octavo bit, se establecen como sigue:
ISO 8859-1 (Latin 1) define la codificación del alfabeto latino, incluyendo los diacríticos
(como letras acentuadas Ñ, Ç ) y letras especiales ((ß, Ø) necesarios para las lenguas:
afrikaans escocés gaélico neerlandés
alemán español gallego noruego
aragonés feroés inglés portugués
catalán, finés islandés sueco
danés francés italiano y vasco.
El siguiente gráfico nos muestra una tabla ASCII-8 muy práctica ya que de una forma muy
cómoda tenemos los tres valores (decimal, hexadecimal y, por consiguiente, también binario)
de cada uno de los 256 caracteres, símbolos y control contemplados.
Por ejemplo, el carácter "ESPACIO EN BLANCO" tiene el valor decimal 32, el valor hexa-
decimal 20 (fila 2, columna 0), y por consiguiente, su valor binario es 0010 0000. El código 0
es el carácter NULO y el 255 es el carácter FIN DE FICHERO (EOF)
Cuando se dan cuenta que están trabajando sobre lo mismo deciden unir sus fuerzas pero
deciden hacer sus publicaciones por separado. Así pues existe una relación entre ambas
publicaciones:
1991 Unicode 1.0 (en ese año se publicó el primer estándar Unicode
(ISBN 0321185781)
1993 Unicode 1.1 es el ISO 10646-1:1993
1996 Unicode 2.0
1998 Unicode 2.1
1999 Unicode 3.0 Cubría 16 bits de la Plana Básica Multilingüe del ISO
10646-1:2000
2001 Unicode 3.1 Introduce Planas suplementarias procedentes del ISO
10646-2:2001
2002 Unicode 3.2
2003 Unicode 4.0 es el ISO 10646:2003
2005 Unicode 4.1
2006 Unicode 5.0
2008 Unicode 5.1.0
2009 Unicode 5.2.0 (Diciembre de 2009)
……………………
En estos momentos (Octubre 2016), la última versión disponible en pdf en la página oficial
es Unicode 9.0.0 (21 junio 2016). El pdf tiene 1036 páginas (13MB):
El Unicode Consortium mantiene estrecha relación con ISO/IEC, con la que mantiene desde
1991 el acuerdo de sincronizar sus estándares que contienen los mismos caracteres y puntos
de código.
Unicode permite que un producto de software o sitio web específico se oriente a múltiples
plataformas, idiomas y países, sin necesidad de rediseñarlo. Además, permite que los datos se
trasladen a través de gran cantidad de sistemas distintos sin sufrir daños.
ACTIVIDAD:
Unicode es, desde 1991, la norma de codificación más universal en la actualidad. Es una
gran tabla que ya en el año 2006 asignaba un punto de código a más de 90.000 símbolos.
Averigua cuántos puntos de código cubre actualmente Unicode.
Una idea importante que tenemos que tener en la cabeza para entender este nuevo sistema de
codificación alfanumérica es que la solución ha venido de separar la norma de codificación
(UNICODE: elección de símbolos y asignación de un código fijo a cada símbolo) de la norma
de transmisión (UTF, UCS), usándose ambas en conjunto.
Así pues, con respecto a la norma de transmisión de puntos de código Unicode, se definie-
ron dos métodos de “mapeo” o de localización de caracteres:
Método UTF-x (Unicode Transformation Format x) Formato de Transformación Unico-
de. (el número en los nombres "x" indican la cantidad de bits de cada carácter):
UTF-7 — norma relativamente poco popular de 7 bits, considerada obsoleta.
UTF-8 — norma de 8 bits de longitud variable
UTF-16 — norma de 16 bits de longitud variable.
UTF-32 — norma de 32 bits de longitud fija. Funcionalmente idéntica a UCS-4
Método UCS-x (Universal Character Set x) Juego de Caracteres Universal. (el número
en los nombres "x" indican la cantidad de bytes de cada carácter):
UCS-2 — norma de 16 bits de longitud fija que solamente permite el "mapeo" o la
búsqueda en la Plana Básica Multilingüe.
UCS-4 — norma de 32 bits de longitud fija.
Ya sabemos que Unicode es el estándar que alberga todas las lenguas de la tierra, sin excep-
ciones, pero…
La solución a este importante dilema vino de la mano de Ken Thompson (creador del sistema
operativo Unix) y Rob Pike. Estos señores inventaron la forma de codificar Unicode mien-
tras cenaban en un restaurant de Austin, Texas. Su genial solución se denominó UTF-8 (Uni-
code Transformation Format-8) y consiste en lo siguiente:
Ejemplo 1
El punto de código en Unicode del carácter H (Letra latina "H" mayúscula) es el U+0048. ¿Cuál
será la secuencia UTF-8 para transmitir/almacenar dicho carácter?
Solución:
Si observamos la tabla anterior, 0x48 es menor que 0x7F por lo tanto se encuentra en el ran-
go de la primera fila, lo cual significa que se transmitirá en un único byte con el bit más alto
puesto a 0.
El binario del hexadecimal 0x48 es b1001000, así pues, su codificación/transformación en
UTF-8 será b01001000, que coincide con binario usado para representar la misma "H"
según la tabla US-ASCII.
Importante: toda la tabla US-ASCII, es decir, aquellos primeros 127 caracteres son exacta-
mente los mismos en Unicode/UTF-8, tienen la misma representación escalar y de esta for-
ma se preserva la compatibilidad hacia atrás.
Ejemplo 2
El punto de código en Unicode del carácter a (Letra latina "a" minúscula) es el U+0061. ¿Cuál
será la secuencia UTF-8 para transmitir/almacenar dicho carácter?
Solución:
0x61 < 0x7F por lo tanto será codificado igualmente con un byte.
Binario : b1100001 Transformación en UTF-8: b01100001
También coincide con el juego de caracteres US-ASCII.
Ejemplo 3
El punto de código en Unicode del carácter Ñ (Letra latina "Ñ" mayúscula) es el U+00D1. ¿Cuál
será la secuencia UTF-8 para transmitir/almacenar dicho carácter?
Solución:
Ejemplo 4
El punto de código en Unicode del carácter ᢅ (Letra mongolania " Ali Gali Baluda”) es el
U+1885. (Nota: para escribir este carácter en el editor de textos en Windows tenemos que
mantener pulsada la tecla Alt mientras escribimos el valor en decimal –en este caso 6277-del
valor Unicode del carácter en el teclado numérico, no el que está en la parte superior del te-
clado). ¿Cuál será la secuencia UTF-8 para transmitir/almacenar dicho carácter?
Solución: