Protocolo TCP-udp
Protocolo TCP-udp
completa del protocolo TCP se encuentra en el documento RFC793 o su traducción al español. TCP
(Transmission-Control-Protocol, en español Protocolo de Control de Transmisión) es de los
protocolos fundamentales en Internet. Fue creado entre los años 1973 - 1974 por Vint Cerf y
Robert Kahn.
Muchos programas dentro de una red de datos compuesta por computadoras pueden usar TCP
para crear conexiones entre ellos a través de las cuales puede enviarse un flujo de datos. El
protocolo garantiza que los datos serán entregados en su destino sin errores y en el mismo orden
en que se transmitieron. También proporciona un mecanismo para distinguir distintas aplicaciones
dentro de una misma máquina, a través del concepto de puerto.
TCP da soporte a muchas de las aplicaciones más populares de Internet, incluidas HTTP, SMTP, SSH
y FTP.
Funciones de TCP
En la pila de protocolos TCP/IP, TCP es la capa intermedia entre el protocolo de internet (IP) y la
aplicación. Habitualmente, las aplicaciones necesitan que la comunicación sea fiable y, dado que la
capa IP aporta un servicio de datagramas no fiable (sin confirmación), TCP añade las funciones
necesarias para prestar un servicio que permita que la comunicación entre dos sistemas se efectúe
libre de errores, sin pérdidas y con seguridad.
Los servicios provistos por TCP corren en el anfitrión (host) de cualquiera de los extremos de una
conexión, no en la red. Por lo tanto, TCP es un protocolo para manejar conexiones de extremo a
extremo. Tales conexiones pueden existir a través de una serie de conexiones punto a punto, por
lo que estas conexiones extremo-extremo son llamadas circuitos virtuales. Las características del
TCP son:
Orientado a la conexión: dos computadoras establecen una conexión para intercambiar datos. Los
sistemas de los extremos se sincronizan con el otro para manejar el flujo de paquetes y adaptarse
a la congestión de la red.
Operación Full-Duplex: una conexión TCP es un par de circuitos virtuales, cada uno en una
dirección. Sólo los dos sistemas finales sincronizados pueden usar la conexión.
Error Checking: una técnica de checksum es usada para verificar que los paquetes no estén
corruptos.
Flow Control: si el transmisor está desbordando el buffer del receptor por transmitir demasiado
rápido, el receptor descarta paquetes. Los acknowledgement fallidos que llegan al transmisor le
alertan para bajar la tasa de transferencia o dejar de transmitir.
Los servicios confiables de entrega de datos son críticos para aplicaciones tales como
transferencias de archivos (FTP por ejemplo), servicios de bases de datos, proceso de
transacciones y otras aplicaciones de misión crítica en las cuales la entrega de cada paquete debe
ser garantizada.
En el nivel de transporte, los paquetes de bits que constituyen las unidades de datos de protocolo
o PDU ('Protocol Data Unit') se llaman "segmentos". El formato de los segmentos TCP se muestra
en el siguiente esquema:
+ Bits 0 - 3 4-7 8 - 15 16 - 31
32 Número de Secuencia
224
Datos
Datos
Las aplicaciones envían flujos de bytes a la capa TCP para ser enviados a la red. TCP divide el flujo
de bytes llegado de la aplicación en segmentos de tamaño apropiado (normalmente esta
limitación viene impuesta por la unidad máxima de transferencia (MTU) del nivel de enlace de
datos de la red a la que la entidad está asociada) y le añade sus cabeceras. Entonces, TCP pasa el
segmento resultante a la capa IP, donde a través de la red, llega a la capa TCP de la entidad
destino. TCP comprueba que ningún segmento se ha perdido dando a cada uno un número de
secuencia, que es también usado para asegurarse de que los paquetes han llegado a la entidad
destino en el orden correcto. TCP devuelve un asentimiento por bytes que han sido recibidos
correctamente; un temporizador en la entidad origen del envío causará un timeout si el
asentimiento no es recibido en un tiempo razonable, y el (presuntamente desaparecido) paquete
será entonces retransmitido. TCP revisa que no haya bytes dañados durante el envío usando un
checksum; es calculado por el emisor en cada paquete antes de ser enviado, y comprobado por el
receptor.
Puerto de origen (16 bits): Identifica el puerto a través del que se envía.
Número de secuencia (32 bits): Sirve para comprobar que ningún segmento se ha perdido, y que
llegan en el orden correcto. Su significado varía dependiendo del valor de SYN:
Si el flag SYN está activo (1), entonces este campo indica el número inicial de secuencia (con lo cual
el número de secuencia del primer byte de datos será este número de secuencia más uno).
Si el flag SYN no está activo (0), entonces este campo indica el número de secuencia del primer
byte de datos.
Número de acuse de recibo (ACK) (32 bits): Si el flag ACK está puesto a activo, entonces en este
campo contiene el número de secuencia del siguiente paquete que el receptor espera recibir.
Longitud de la cabecera TCP (4 bits): Especifica el tamaño de la cabecera TCP en palabras de 32-
bits. El tamaño mínimo es de 5 palabras, y el máximo es de 15 palabras (lo cual equivale a un
tamaño mínimo de 20 bytes y a un máximo de 60 bytes). En inglés el campo se denomina “Data
offset”, que literalmente sería algo así como “desplazamiento hasta los datos”, ya que indica
cuántos bytes hay entre el inicio del paquete TCP y el inicio de los datos.
Reservado (4 bits): Bits reservados para uso futuro, deberían ser puestos a cero.
Bits de control (flags) (8 bits): Son 8 flags o banderas. Cada una indica “activa” con un 1 o
“inactiva” con un 0.
CWR o “Congestion Window Reduced” (1 bit): Este flag se activa (se pone a 1) por parte del emisor
para indicar que ha recibido un paquete TCP con el flag ECE activado. El flag ECE es una extensión
del protocolo que fue añadida a la cabecera en el RFC 3168. Se utiliza para el control de la
congestión en la red.
ECE o “ECN-Echo” (1 bit): Indica que el receptor puede realizar notificaciones ECN. La activación de
este flag se realiza durante la negociación en tres pasos para el establecimiento de la conexión.
Este flag también fue añadido a la cabecera en el RFC 3168.
URG o “urgent” (1 bit, ver URG): Si está activo significa que el campo “Urgente” es significativo, si
no, el valor de este campo es ignorado.
ACK o “acknowledge” (1 bit, ver ACK): Si está activo entonces el campo con el número de acuse de
recibo es válido (si no, es ignorado).
PSH o “push” (1 bit, ver PSH): Activa/desactiva la función que hace que los datos de ese segmento
y los datos que hayan sido almacenados anteriormente en el buffer del receptor deben ser
transferidos a la aplicación receptora lo antes posible.
RST o “reset” (1 bit, ver Flag RST): Si llega a 1, termina la conexión sin esperar respuesta.
FIN (1 bit, ver FIN): Si se activa es porque no hay más datos a enviar por parte del emisor, esto es,
el paquete que lo lleva activo es el último de una conexión.
Ventana (16 bits): Es el tamaño de la ventana de recepción, que especifica el número de bytes que
el receptor está actualmente esperando recibir.
Suma de verificación (checksum) (16 bits): Es una suma de verificación utilizada para comprobar si
hay errores tanto en la cabecera como en los datos.
Puntero urgente (16 bits): Si el flag URG está activado, entonces este campo indica el
desplazamiento respecto al número de secuencia que indica el último byte de datos marcados
como “urgentes”.
Opciones (número de bits variable): La longitud total del campo de opciones ha de ser múltiplo de
una palabra de 32 bits (si es menor, se ha de rellenar al múltiplo más cercano), y el campo que
indica la longitud de la cabecera ha de estar ajustado de forma adecuada.
Datos (número de bits variable): No forma parte de la cabecera, es la carga (payload), la parte con
los datos del paquete TCP. Pueden ser datos de cualquier protocolo de nivel superior en el nivel de
aplicación; los protocolos más comunes para los que se usan los datos de un paquete TCP son
HTTP, telnet, SSH, FTP, etcétera.
Establecimiento de la negociación
Aunque es posible que un par de entidades finales comiencen una conexión entre ellas
simultáneamente, normalmente una de ellas abre un socket en un determinado puerto tcp y se
queda a la escucha de nuevas conexiones. Es común referirse a esto como apertura pasiva, y
determina el lado servidor de una conexión. El lado cliente de una conexión realiza una apertura
activa de un puerto enviando un paquete SYN inicial al servidor como parte de la negociación en
tres pasos. En el lado del servidor se comprueba si el puerto está abierto, es decir, si existe algún
proceso escuchando en ese puerto. En caso de no estarlo, se envía al cliente un paquete de
respuesta con el bit RST activado, lo que significa el rechazo del intento de conexión. En caso de
que sí se encuentre abierto el puerto, el lado servidor respondería a la petición SYN válida con un
paquete SYN/ACK. Finalmente, el cliente debería responderle al servidor con un ACK, completando
así la negociación en tres pasos (SYN, SYN/ACK y ACK) y la fase de establecimiento de conexión.
Transferencia de datos
Durante la etapa de transferencia de datos, una serie de mecanismos claves determinan la
fiabilidad y robustez del protocolo. Entre ellos están incluidos el uso del número de secuencia para
ordenar los segmentos TCP recibidos y detectar paquetes duplicados, checksums para detectar
errores, y asentimientos y temporizadores para detectar pérdidas y retrasos.
A través del uso de números de secuencia y asentimiento, TCP puede pasar los segmentos
recibidos en el orden correcto dentro del flujo de bytes a la aplicación receptora. Los números de
secuencia son de 32 bits (sin signo), que vuelve a cero tras el siguiente byte después del 232-1.
Una de las claves para mantener la robustez y la seguridad de las conexiones TCP es la selección
del número inicial de secuencia (ISN, Initial Sequence Number).
Hay que fijarse en que el checksum de TCP también cubre los 96 bit de la cabecera que contiene la
dirección origen, la dirección destino, el protocolo y el tamaño TCP. Esto proporciona protección
contra paquetes mal dirigidos por errores en las direcciones.
El checksum de TCP es una comprobación bastante débil. En niveles de enlace con una alta
probabilidad de error de bit quizá requiera una capacidad adicional de corrección/detección de
errores de enlace. Si TCP fuese rediseñado hoy, muy probablemente tendría un código de
redundancia cíclica (CRC) para control de errores en vez del actual checksum. La debilidad del
checksum está parcialmente compensada por el extendido uso de un CRC en el nivel de enlace,
bajo TCP e IP, como el usado en el PPP o en Ethernet. Sin embargo, esto no significa que el
checksum de 16 bits es redundante: sorprendentemente, inspecciones sobre el tráfico de Internet
han mostrado que son comunes los errores de software y hardware[cita requerida] que
introducen errores en los paquetes protegidos con un CRC, y que el checksum de 16 bits de TCP
detecta la mayoría de estos errores simples.
Los asentimientos (ACKs o Acknowledgments) de los datos enviados o la falta de ellos, son usados
por los emisores para interpretar las condiciones de la red entre el emisor y receptor TCP. Unido a
los temporizadores, los emisores y receptores TCP pueden alterar el comportamiento del
movimiento de datos. TCP usa una serie de mecanismos para conseguir un alto rendimiento y
evitar la congestión de la red (la idea es enviar tan rápido como el receptor pueda recibir). Estos
mecanismos incluyen el uso de ventana deslizante, que controla que el transmisor mande
información dentro de los límites del buffer del receptor, y algoritmos de control de flujo, tales
como el algoritmo de Evitación de la Congestión (congestion avoidance), el de comienzo lento
(Slow-start), el de retransmisión rápida, el de recuperación rápida (Fast Recovery), y otros.
Es interesante notar que existe un número de secuencia generado por cada lado, ayudando de
este modo a que no se puedan establecer conexiones falseadas (spoofing).
Tamaño de ventana
El tamaño de la ventana de recepción TCP es la cantidad de datos recibidos (en bytes) que pueden
ser metidos en el buffer de recepción durante la conexión. La entidad emisora puede enviar una
cantidad determinada de datos pero antes debe esperar un asentimiento con la actualización del
tamaño de ventana por parte del receptor.
Un ejemplo sería el siguiente: un receptor comienza con un tamaño de ventana x y recibe y bytes,
entonces su tamaño de ventana será (x - y) y el transmisor sólo podrá mandar paquetes con un
tamaño máximo de datos de (x - y) bytes. Los siguientes paquetes recibidos seguirán restando
tamaño a la ventana de recepción. Esta situación seguirá así hasta que la aplicación receptora
recoja los datos del buffer de recepción. Para una mayor eficiencia en redes de gran ancho de
banda, debe ser usado un tamaño de ventana mayor. El campo TCP de tamaño de ventana
controla el movimiento de datos y está limitado a 16 bits, es decir, a un tamaño de ventana de
65.535 bytes.
Escalado de ventana
La opción de escala de ventana TCP es usada solo durante la negociación en tres pasos que
constituye el comienzo de la conexión. El valor de la escala representa el número de bits
desplazados a la izquierda de los 16 bits que forman el campo del tamaño de ventana. El valor de
la escala puede ir desde 0 (sin desplazamiento) hasta 14. Hay que recordar que un número binario
desplazado un bit a la izquierda es como multiplicarlo en base decimal por 2.
Fin de la conexión
La fase de finalización de la conexión usa una negociación en cuatro pasos (four-way handshake),
terminando la conexión desde cada lado independientemente. Cuando uno de los dos extremos
de la conexión desea parar su "mitad" de conexión transmite un paquete FIN, que el otro
interlocutor asentirá con un ACK. Por tanto, una desconexión típica requiere un par de segmentos
FIN y ACK desde cada lado de la conexión.
Una conexión puede estar "medio abierta" en el caso de que uno de los lados la finalice pero el
otro no. El lado que ha dado por finalizada la conexión no puede enviar más datos pero la otra
parte si podrá.
Puertos TCP
TCP usa el concepto de número de puerto para identificar a las aplicaciones emisoras y receptoras.
Cada lado de la conexión TCP tiene asociado un número de puerto (de 16 bits sin signo, con lo que
existen 65536 puertos posibles) asignado por la aplicación emisora o receptora. Los puertos son
clasificados en tres categorías: bien conocidos, registrados y dinámicos/privados. Los puertos bien
conocidos son asignados por la Internet Assigned Numbers Authority (IANA), van del 0 al 1023 y
son usados normalmente por el sistema o por procesos con privilegios. Las aplicaciones que usan
este tipo de puertos son ejecutadas como servidores y se quedan a la escucha de conexiones.
Algunos ejemplos son: FTP (21), SSH (22), Telnet (23), SMTP (25) y HTTP (80). Los puertos
registrados son normalmente empleados por las aplicaciones de usuario de forma temporal
cuando conectan con los servidores, pero también pueden representar servicios que hayan sido
registrados por un tercero (rango de puertos registrados: 1024 al 49151). Los puertos
dinámicos/privados también pueden ser usados por las aplicaciones de usuario, pero este caso es
menos común. Los puertos dinámicos/privados no tienen significado fuera de la conexión TCP en
la que fueron usados (rango de puertos dinámicos/privados: 49152 al 65535, recordemos que el
rango total de 2 elevado a la potencia 16, cubre 65536 números, del 0 al 65535).
Desarrollo de TCP
TCP es un protocolo muy desarrollado y complejo. Sin embargo, mientras mejoras significativas
han sido propuestas y llevadas a cabo a lo largo de los años, ha conservado las operaciones más
básicas sin cambios desde el RFC 793, publicado en 1981. El documento RFC 1122 (Host
Requirements for Internet Hosts), especifica el número de requisitos de una implementación del
protocolo TCP. El RFC 2581 (Control de Congestión TCP) es uno de los más importantes
documentos relativos a TCP de los últimos años, describe nuevos algoritmos para evitar la
congestión excesiva. En 2001, el RFC 3168 fue escrito para describir la Notificación de Congestión
Explícita (ECN), una forma de eludir la congestión con mecanismos de señalización. En los
comienzos del siglo XXI, TCP es usado en el 95% de todos los paquetes que circulan por Internet.
Entre las aplicaciones más comunes que usan TCP están HTTP/HTTPS (World Wide Web),
SMTP/POP3/IMAP (correo electrónico) y FTP (transferencia de ficheros). Su amplia extensión ha
sido la prueba para los desarrolladores originales de que su creación estaba excepcionalmente
bien hecha.
Protocolo UDP[editar]
Descripción
En la familia de protocolos de Internet UDP proporciona una sencilla interfaz entre la capa de red y
la capa de aplicación. UDP no otorga garantías para la entrega de sus mensajes y el origen UDP no
retiene estados de los mensajes UDP que han sido enviados a la red. UDP sólo añade multiplexado
de aplicación y suma de verificación de la cabecera y la carga útil. Cualquier tipo de garantías para
la transmisión de la información deben ser implementadas en capas superiores.
La cabecera UDP consta de 4 campos de los cuales 2 son opcionales (con fondo rojo en la tabla).
Los campos de los puertos fuente y destino son campos de 16 bits que identifican el proceso de
origen y recepción. Ya que UDP carece de un servidor de estado y el origen UDP no solicita
respuestas, el puerto origen es opcional. En caso de no ser utilizado, el puerto origen debe ser
puesto a cero. A los campos del puerto destino le sigue un campo obligatorio que indica el tamaño
en bytes del datagrama UDP incluidos los datos. El valor mínimo es de 8 bytes. El campo de la
cabecera restante es una suma de comprobación de 16 bits que abarca la cabecera, los datos y
una pseudo-cabecera con las IP origen y destino, el protocolo, la longitud del datagrama y 0's
hasta completar un múltiplo de 16. pero no los datos. El checksum también es opcional, aunque
generalmente se utiliza en la práctica.
El protocolo UDP se utiliza por ejemplo cuando se necesita transmitir voz o vídeo y resulta más
importante transmitir con velocidad que garantizar el hecho de que lleguen absolutamente todos
los bytes.
Puertos
UDP utiliza puertos para permitir la comunicación entre aplicaciones. El campo de puerto tiene
una longitud de 16 bits, por lo que el rango de valores válidos va de 0 a 65.535. El puerto 0 está
reservado, pero es un valor permitido como puerto origen si el proceso emisor no espera recibir
mensajes como respuesta.
Los puertos 1 a 1023 se llaman puertos "bien conocidos" y en sistemas operativos tipo Unix
enlazar con uno de estos puertos requiere acceso como superusuario.
Los puertos 49.152 a 65.535 son puertos efímeros y son utilizados como puertos temporales,
sobre todo por los clientes al comunicarse con los servidores.
Ejemplo en python
El siguiente ejemplo muestra cómo usar el protocolo UDP para una comunicación cliente/servidor:
Servidor:
import socket
PUERTO = 10000
BUFLEN = 512
server = [Link](socket.AF_INET, socket.SOCK_DGRAM, socket.IPPROTO_UDP)
[Link](('', PUERTO))
while True:
import socket
IP_SERVIDOR = '[Link]'
PUERTO_SERVIDOR = 10000
for i in range(3):
[Link]()
Ejemplo en C++
El siguiente ejemplo muestra cómo usar el protocolo UDP para una comunicación cliente/servidor:
Servidor:
#include <winsock.h>
#pragma comment(lib,"ws2_32.lib")
int main()
WSADATA wsaData;
SOCKET RecvSocket;
sockaddr_in RecvAddr;
char RecvBuf[1024];
sockaddr_in SenderAddr;
WSAStartup(MAKEWORD(2,2), &wsaData);
RecvAddr.sin_family = AF_INET;
RecvAddr.sin_port = htons(Puerto);
RecvAddr.sin_addr.s_addr = INADDR_ANY;
printf("%s\n",RecvBuf);
closesocket(RecvSocket);
WSACleanup();
#include <winsock.h>
#pragma comment(lib,"ws2_32.lib")
int main()
WSADATA wsaData;
SOCKET SendSocket;
sockaddr_in RecvAddr;
WSAStartup(MAKEWORD(2,2), &wsaData);
RecvAddr.sin_family = AF_INET;
RecvAddr.sin_port = htons(Puerto);
RecvAddr.sin_addr.s_addr = inet_addr(ip);
sendto(SendSocket,SendBuf,strlen(SendBuf)+1,0,(SOCKADDR *)
&RecvAddr,sizeof(RecvAddr));
WSACleanup();
UDP
Proporciona un nivel de transporte no fiable de datagramas, ya que apenas añade la información
necesaria para la comunicación extremo a extremo al paquete que envía al nivel inferior. Lo
utilizan aplicaciones como NFS (Network File System) y RCP (comando para copiar ficheros entre
ordenadores remotos), pero sobre todo se emplea en tareas de control y en la transmisión de
audio y vídeo a través de una red. No introduce retardos para establecer una conexión, no
mantiene estado de conexión alguno y no realiza seguimiento de estos parámetros. Así, un
servidor dedicado a una aplicación particular puede soportar más clientes activos cuando la
aplicación corre sobre UDP en lugar de sobre TCP.
TCP
Es el protocolo que proporciona un transporte fiable de flujo de bits entre aplicaciones. Está
pensado para poder enviar grandes cantidades de información de forma fiable, liberando al
programador de la dificultad de gestionar la fiabilidad de la conexión (retransmisiones, pérdida de
paquetes, orden en el que llegan los paquetes, duplicados de paquetes...) que gestiona el propio
protocolo. Pero la complejidad de la gestión de la fiabilidad tiene un coste en eficiencia, ya que
para llevar a cabo las gestiones anteriores se tiene que añadir bastante información a los paquetes
que enviar. Debido a que los paquetes para enviar tienen un tamaño máximo, cuanta más
información añada el protocolo para su gestión, menos información que proviene de la aplicación
podrá contener ese paquete (el segmento TCP tiene una sobrecarga de 20 bytes en cada
segmento, mientras que UDP solo añade 8 bytes). Por eso, cuando es más importante la velocidad
que la fiabilidad, se utiliza UDP. En cambio, TCP asegura la recepción en destino de la información
para transmitir.
UDP es generalmente el protocolo usado en la transmisión de vídeo y voz a través de una red. Esto
es porque no hay tiempo para enviar de nuevo paquetes perdidos cuando se está escuchando a
alguien o viendo un vídeo en tiempo real.
Ya que tanto TCP como UDP circulan por la misma red, en muchos casos ocurre que el aumento
del tráfico UDP daña el correcto funcionamiento de las aplicaciones TCP. Por defecto, TCP pasa a
un segundo lugar para dejar a los datos en tiempo real usar la mayor parte del ancho de banda. El
problema es que ambos son importantes para la mayor parte de las aplicaciones, por lo que
encontrar el equilibrio entre ambos es crucial.
Números de puerto bien conocidos usados por TCP y UDP. También se añade algún otro puerto no
asignado oficialmente por IANA, pero de interés general dado el uso extendido que le da alguna
aplicación.
Puerto/protocolo Descripción
25/tcp SMTP Simple Mail Transfer Protocol (Protocolo Simple de Transferencia de Correo)
37/tcp time
43/tcp nicname
69/udp TFTP Trivial File Transfer Protocol (Protocolo Trivial de Transferencia de Ficheros)
70/tcp Gopher
79/tcp Finger
111/tcpsunrpc
135/tcpepmap
162/tcpSNMP-trap
162/udp SNMP-trap
512/tcpexec
513/tcplogin
520/udp RIP
1433/tcp Microsoft-SQL-Server
1434/tcp Microsoft-SQL-Monitor
1434/udp Microsoft-SQL-Monitor
1512/tcp WINS
3030/tcp NetPanzer
3030/upd NetPanzer
3128/tcp HTTP usado por web caches y por defecto en Squid cache
3128/tcp NDL-AAS
6112/udp Blizzard
6347/udp Gnutella
6348/udp Gnutella
6349/udp Gnutella
6350/udp Gnutella
6355/udp Gnutella
8080/tcp HTTP HTTP-ALT ver puerto 80. Tomcat lo usa como puerto por defecto.
8118/tcp privoxy
Muchos programas dentro de una red de datos compuesta por computadoras pueden usar
TCP para crear conexiones entre ellos a través de las cuales puede enviarse un flujo de datos.
El protocolo garantiza que los datos serán entregados en su destino sin errores y en el mismo
orden en que se transmitieron. También proporciona un mecanismo para distinguir distintas
aplicaciones dentro de una misma máquina, a través del concepto de puerto.
TCP da soporte a muchas de las aplicaciones más populares de Internet, incluidas HTTP,
SMTP, SSH y FTP.
Funciones de TCP
En la pila de protocolos TCP/IP, TCP es la capa intermedia entre el protocolo de internet (IP) y
la aplicación. Habitualmente, las aplicaciones necesitan que la comunicación sea fiable y,
dado que la capa IP aporta un servicio de datagramas no fiable (sin confirmación), TCP añade
las funciones necesarias para prestar un servicio que permita que la comunicación entre dos
sistemas se efectúe libre de errores, sin pérdidas y con seguridad.
Los servicios provistos por TCP corren en el anfitrión (host) de cualquiera de los extremos de
una conexión, no en la red. Por lo tanto, TCP es un protocolo para manejar conexiones de
extremo a extremo. Tales conexiones pueden existir a través de una serie de conexiones
punto a punto, por lo que estas conexiones extremo-extremo son llamadas circuitos virtuales.
Las características del TCP son:
Los servicios confiables de entrega de datos son críticos para aplicaciones tales como
transferencias de archivos (FTP por ejemplo), servicios de bases de datos, proceso de
transacciones y otras aplicaciones de misión crítica en las cuales la entrega de cada paquete
debe ser garantizada.
En el nivel de transporte, los paquetes de bits que constituyen las unidades de datos de
protocolo o PDU ('Protocol Data Unit') se llaman "segmentos". El formato de los segmentos
TCP se muestra en el siguiente esquema:
+ Bits 0 - 3 4-7 8 - 15 16 - 31
32 Número de Secuencia
longitud
96 cabecera Reservado Flags Ventana
TCP
128 Suma de Verificación (Checksum) Puntero Urgente
224 Datos
Datos
Las aplicaciones envían flujos de bytes a la capa TCP para ser enviados a la red. TCP divide
el flujo de bytes llegado de la aplicación en segmentos de tamaño apropiado (normalmente
esta limitación viene impuesta por la unidad máxima de transferencia (MTU) del nivel de
enlace de datos de la red a la que la entidad está asociada) y le añade sus cabeceras.
Entonces, TCP pasa el segmento resultante a la capa IP, donde a través de la red, llega a la
capa TCP de la entidad destino. TCP comprueba que ningún segmento se ha perdido dando a
cada uno un número de secuencia, que es también usado para asegurarse de que los
paquetes han llegado a la entidad destino en el orden correcto. TCP devuelve un asentimiento
por bytes que han sido recibidos correctamente; un temporizador en la entidad origen del
envío causará un timeout si el asentimiento no es recibido en un tiempo razonable, y el
(presuntamente desaparecido) paquete será entonces retransmitido. TCP revisa que no haya
bytes dañados durante el envío usando un checksum; es calculado por el emisor en cada
paquete antes de ser enviado, y comprobado por el receptor.
Puerto de origen (16 bits): Identifica el puerto a través del que se envía.
Puerto destino (16 bits): Identifica el puerto del receptor.
Número de secuencia (32 bits): Sirve para comprobar que ningún segmento se ha
perdido, y que llegan en el orden correcto. Su significado varía dependiendo del valor de
SYN:
Si el flag SYN está activo (1), entonces este campo indica el número inicial de secuencia
(con lo cual el número de secuencia del primer byte de datos será este número de
secuencia más uno).
Si el flag SYN no está activo (0), entonces este campo indica el número de secuencia del
primer byte de datos.
Número de acuse de recibo (ACK) (32 bits): Si el flag ACK está puesto a activo, entonces
en este campo contiene el número de secuencia del siguiente paquete que el receptor
espera recibir.
Longitud de la cabecera TCP (4 bits): Especifica el tamaño de la cabecera TCP en
palabras de 32-bits. El tamaño mínimo es de 5 palabras, y el máximo es de 15 palabras
(lo cual equivale a un tamaño mínimo de 20 bytes y a un máximo de 60 bytes). En inglés
el campo se denomina “Data offset”, que literalmente sería algo así como “desplazamiento
hasta los datos”, ya que indica cuántos bytes hay entre el inicio del paquete TCP y el inicio
de los datos.
Reservado (4 bits): Bits reservados para uso futuro, deberían ser puestos a cero.
Bits de control (flags) (8 bits): Son 8 flags o banderas. Cada una indica “activa” con un 1 o
“inactiva” con un 0.
CWR o “Congestion Window Reduced” (1 bit): Este flag se activa (se pone a 1) por parte
del emisor para indicar que ha recibido un paquete TCP con el flag ECE activado. El flag
ECE es una extensión del protocolo que fue añadida a la cabecera en el RFC 3168. Se
utiliza para el control de la congestión en la red.
ECE o “ECN-Echo” (1 bit): Indica que el receptor puede realizar notificaciones ECN. La
activación de este flag se realiza durante la negociación en tres pasos para el
establecimiento de la conexión. Este flag también fue añadido a la cabecera en el RFC
3168.
URG o “urgent” (1 bit, ver URG): Si está activo significa que el campo “Urgente” es
significativo, si no, el valor de este campo es ignorado.
ACK o “acknowledge” (1 bit, ver ACK): Si está activo entonces el campo con el número de
acuse de recibo es válido (si no, es ignorado).
PSH o “push” (1 bit, ver PSH): Activa/desactiva la función que hace que los datos de ese
segmento y los datos que hayan sido almacenados anteriormente en el buffer del receptor
deben ser transferidos a la aplicación receptora lo antes posible.
RST o “reset” (1 bit, ver Flag RST): Si llega a 1, termina la conexión sin esperar respuesta.
SYN o “synchronize” (1 bit, ver SYN): Activa/desactiva la sincronización de los números de
secuencia.
FIN (1 bit, ver FIN): Si se activa es porque no hay más datos a enviar por parte del emisor,
esto es, el paquete que lo lleva activo es el último de una conexión.
Establecimiento de la negociación
Aunque es posible que un par de entidades finales comiencen una conexión entre ellas
simultáneamente, normalmente una de ellas abre un socket en un determinado puerto tcp y se
queda a la escucha de nuevas conexiones. Es común referirse a esto como apertura pasiva, y
determina el lado servidor de una conexión. El lado cliente de una conexión realiza una
apertura activa de un puerto enviando un paquete SYN inicial al servidor como parte de la
negociación en tres pasos. En el lado del servidor se comprueba si el puerto está abierto, es
decir, si existe algún proceso escuchando en ese puerto. En caso de no estarlo, se envía al
cliente un paquete de respuesta con el bit RST activado, lo que significa el rechazo del intento
de conexión. En caso de que sí se encuentre abierto el puerto, el lado servidor respondería a
la petición SYN válida con un paquete SYN/ACK. Finalmente, el cliente debería responderle al
servidor con un ACK, completando así la negociación en tres pasos (SYN, SYN/ACK y ACK) y
la fase de establecimiento de conexión.
Transferencia de datos
A través del uso de números de secuencia y asentimiento, TCP puede pasar los segmentos
recibidos en el orden correcto dentro del flujo de bytes a la aplicación receptora. Los números
de secuencia son de 32 bits (sin signo), que vuelve a cero tras el siguiente byte después del
232-1. Una de las claves para mantener la robustez y la seguridad de las conexiones TCP es
la selección del número inicial de secuencia (ISN, Initial Sequence Number).
Hay que fijarse en que el checksum de TCP también cubre los 96 bit de la cabecera que
contiene la dirección origen, la dirección destino, el protocolo y el tamaño TCP. Esto
proporciona protección contra paquetes mal dirigidos por errores en las direcciones.
El checksum de TCP es una comprobación bastante débil. En niveles de enlace con una alta
probabilidad de error de bit quizá requiera una capacidad adicional de corrección/detección de
errores de enlace. Si TCP fuese rediseñado hoy, muy probablemente tendría un código de
redundancia cíclica (CRC) para control de errores en vez del actual checksum. La debilidad
del checksum está parcialmente compensada por el extendido uso de un CRC en el nivel de
enlace, bajo TCP e IP, como el usado en el PPP o en Ethernet. Sin embargo, esto no significa
que el checksum de 16 bits es redundante: sorprendentemente, inspecciones sobre el tráfico
de Internet han mostrado que son comunes los errores de software y hardware[cita requerida]
que introducen errores en los paquetes protegidos con un CRC, y que el checksum de 16 bits
de TCP detecta la mayoría de estos errores simples.
Los asentimientos (ACKs o Acknowledgments) de los datos enviados o la falta de ellos, son
usados por los emisores para interpretar las condiciones de la red entre el emisor y receptor
TCP. Unido a los temporizadores, los emisores y receptores TCP pueden alterar el
comportamiento del movimiento de datos. TCP usa una serie de mecanismos para conseguir
un alto rendimiento y evitar la congestión de la red (la idea es enviar tan rápido como el
receptor pueda recibir). Estos mecanismos incluyen el uso de ventana deslizante, que controla
que el transmisor mande información dentro de los límites del buffer del receptor, y algoritmos
de control de flujo, tales como el algoritmo de Evitación de la Congestión (congestion
avoidance), el de comienzo lento (Slow-start), el de retransmisión rápida, el de recuperación
rápida (Fast Recovery), y otros.
Es interesante notar que existe un número de secuencia generado por cada lado, ayudando
de este modo a que no se puedan establecer conexiones falseadas (spoofing).
Tamaño de ventana
El tamaño de la ventana de recepción TCP es la cantidad de datos recibidos (en bytes) que
pueden ser metidos en el buffer de recepción durante la conexión. La entidad emisora puede
enviar una cantidad determinada de datos pero antes debe esperar un asentimiento con la
actualización del tamaño de ventana por parte del receptor.
Un ejemplo sería el siguiente: un receptor comienza con un tamaño de ventana x y recibe y
bytes, entonces su tamaño de ventana será (x - y) y el transmisor sólo podrá mandar paquetes
con un tamaño máximo de datos de (x - y) bytes. Los siguientes paquetes recibidos seguirán
restando tamaño a la ventana de recepción. Esta situación seguirá así hasta que la aplicación
receptora recoja los datos del buffer de recepción. Para una mayor eficiencia en redes de gran
ancho de banda, debe ser usado un tamaño de ventana mayor. El campo TCP de tamaño de
ventana controla el movimiento de datos y está limitado a 16 bits, es decir, a un tamaño de
ventana de 65.535 bytes.
Escalado de ventana
La opción de escala de ventana TCP es usada solo durante la negociación en tres pasos que
constituye el comienzo de la conexión. El valor de la escala representa el número de bits
desplazados a la izquierda de los 16 bits que forman el campo del tamaño de ventana. El valor
de la escala puede ir desde 0 (sin desplazamiento) hasta 14. Hay que recordar que un número
binario desplazado un bit a la izquierda es como multiplicarlo en base decimal por 2.
Fin de la conexión
Una conexión puede estar "medio abierta" en el caso de que uno de los lados la finalice pero
el otro no. El lado que ha dado por finalizada la conexión no puede enviar más datos pero la
otra parte si podrá.
Puertos TCP
TCP usa el concepto de número de puerto para identificar a las aplicaciones emisoras y
receptoras. Cada lado de la conexión TCP tiene asociado un número de puerto (de 16 bits sin
signo, con lo que existen 65536 puertos posibles) asignado por la aplicación emisora o
receptora. Los puertos son clasificados en tres categorías: bien conocidos, registrados y
dinámicos/privados. Los puertos bien conocidos son asignados por la Internet Assigned
Numbers Authority (IANA), van del 0 al 1023 y son usados normalmente por el sistema o por
procesos con privilegios. Las aplicaciones que usan este tipo de puertos son ejecutadas como
servidores y se quedan a la escucha de conexiones. Algunos ejemplos son: FTP (21), SSH
(22), Telnet (23), SMTP (25) y HTTP (80). Los puertos registrados son normalmente
empleados por las aplicaciones de usuario de forma temporal cuando conectan con los
servidores, pero también pueden representar servicios que hayan sido registrados por un
tercero (rango de puertos registrados: 1024 al 49151). Los puertos dinámicos/privados
también pueden ser usados por las aplicaciones de usuario, pero este caso es menos común.
Los puertos dinámicos/privados no tienen significado fuera de la conexión TCP en la que
fueron usados (rango de puertos dinámicos/privados: 49152 al 65535, recordemos que el
rango total de 2 elevado a la potencia 16, cubre 65536 números, del 0 al 65535).
Desarrollo de TCP
Protocolo UDP[editar]
La descripción completa del protocolo UDP se encuentra en el documento RFC768 o
su traducción al español.
Descripción
En la familia de protocolos de Internet UDP proporciona una sencilla interfaz entre la capa de
red y la capa de aplicación. UDP no otorga garantías para la entrega de sus mensajes y el
origen UDP no retiene estados de los mensajes UDP que han sido enviados a la red. UDP
sólo añade multiplexado de aplicación y suma de verificación de la cabecera y la carga útil.
Cualquier tipo de garantías para la transmisión de la información deben ser implementadas en
capas superiores.
La cabecera UDP consta de 4 campos de los cuales 2 son opcionales (con fondo rojo en la
tabla). Los campos de los puertos fuente y destino son campos de 16 bits que identifican el
proceso de origen y recepción. Ya que UDP carece de un servidor de estado y el origen UDP
no solicita respuestas, el puerto origen es opcional. En caso de no ser utilizado, el puerto
origen debe ser puesto a cero. A los campos del puerto destino le sigue un campo obligatorio
que indica el tamaño en bytes del datagrama UDP incluidos los datos. El valor mínimo es de 8
bytes. El campo de la cabecera restante es una suma de comprobación de 16 bits que abarca
la cabecera, los datos y una pseudo-cabecera con las IP origen y destino, el protocolo, la
longitud del datagrama y 0's hasta completar un múltiplo de 16. pero no los datos. El
checksum también es opcional, aunque generalmente se utiliza en la práctica.
El protocolo UDP se utiliza por ejemplo cuando se necesita transmitir voz o vídeo y resulta
más importante transmitir con velocidad que garantizar el hecho de que lleguen
absolutamente todos los bytes.
Puertos
UDP utiliza puertos para permitir la comunicación entre aplicaciones. El campo de puerto tiene
una longitud de 16 bits, por lo que el rango de valores válidos va de 0 a 65.535. El puerto 0
está reservado, pero es un valor permitido como puerto origen si el proceso emisor no espera
recibir mensajes como respuesta.
Los puertos 1 a 1023 se llaman puertos "bien conocidos" y en sistemas operativos tipo Unix
enlazar con uno de estos puertos requiere acceso como superusuario.
Los puertos 1024 a 49.151 son puertos registrados.
Los puertos 49.152 a 65.535 son puertos efímeros y son utilizados como puertos temporales,
sobre todo por los clientes al comunicarse con los servidores.
Ejemplo en python
El siguiente ejemplo muestra cómo usar el protocolo UDP para una comunicación
cliente/servidor:
Servidor:
import socket
PUERTO = 10000
BUFLEN = 512
while True:
(message, address) = [Link](BUFLEN)
print 'Recibiendo paquete desde %s:%d' % (address[0], address[1])
print 'Dato: %s' % message
import socket
IP_SERVIDOR = '[Link]'
PUERTO_SERVIDOR = 10000
for i in range(3):
print 'Enviando paquete %d' % i
message = 'Este es el paquete %d' % i
[Link](message, (IP_SERVIDOR, PUERTO_SERVIDOR))
[Link]()
Ejemplo en C++
El siguiente ejemplo muestra cómo usar el protocolo UDP para una comunicación
cliente/servidor:
Servidor:
#include <winsock.h>
#pragma comment(lib,"ws2_32.lib")
int main()
{
WSADATA wsaData;
SOCKET RecvSocket;
sockaddr_in RecvAddr;
int Puerto = 2345;
char RecvBuf[1024];
int BufLen = 1024;
sockaddr_in SenderAddr;
int SenderAddrSize = sizeof(SenderAddr);
WSAStartup(MAKEWORD(2,2), &wsaData);
RecvSocket = socket(AF_INET, SOCK_DGRAM, IPPROTO_UDP);
RecvAddr.sin_family = AF_INET;
RecvAddr.sin_port = htons(Puerto);
RecvAddr.sin_addr.s_addr = INADDR_ANY;
bind(RecvSocket, (SOCKADDR *) &RecvAddr, sizeof(RecvAddr));
recvfrom(RecvSocket,RecvBuf, BufLen,0,(SOCKADDR
*)&SenderAddr,&SenderAddrSize);
printf("%s\n",RecvBuf);
closesocket(RecvSocket);
WSACleanup();
}
#include <winsock.h>
#pragma comment(lib,"ws2_32.lib")
int main()
{
WSADATA wsaData;
SOCKET SendSocket;
sockaddr_in RecvAddr;
int Puerto = 2345;
char ip[] = "[Link]";
char SendBuf[] = "Hola!!!!";
WSAStartup(MAKEWORD(2,2), &wsaData);
SendSocket = socket(AF_INET, SOCK_DGRAM, IPPROTO_UDP);
RecvAddr.sin_family = AF_INET;
RecvAddr.sin_port = htons(Puerto);
RecvAddr.sin_addr.s_addr = inet_addr(ip);
sendto(SendSocket,SendBuf,strlen(SendBuf)+1,0,(SOCKADDR *)
&RecvAddr,sizeof(RecvAddr));
WSACleanup();
}
Ya que tanto TCP como UDP circulan por la misma red, en muchos casos ocurre que
el aumento del tráfico UDP daña el correcto funcionamiento de las aplicaciones TCP.
Por defecto, TCP pasa a un segundo lugar para dejar a los datos en tiempo real usar
la mayor parte del ancho de banda. El problema es que ambos son importantes para
la mayor parte de las aplicaciones, por lo que encontrar el equilibrio entre ambos es
crucial.
Números de puerto bien conocidos usados por TCP y UDP. También se añade algún
otro puerto no asignado oficialmente por IANA, pero de interés general dado el uso
extendido que le da alguna aplicación.
Puerto/
Descripción
protocolo
37/tcp time
43/tcp nicname
70/tcp Gopher
79/tcp Finger
111/tcp sunrpc
135/tcp epmap
162/tcp SNMP-trap
162/udp SNMP-trap
512/tcp exec
513/tcp login
520/udp RIP
1433/tcp Microsoft-SQL-Server
1434/tcp Microsoft-SQL-Monitor
1434/udp Microsoft-SQL-Monitor
1512/tcp WINS
3030/tcp NetPanzer
3030/upd NetPanzer
3128/tcp HTTP usado por web caches y por defecto en Squid cache
3128/tcp NDL-AAS
6112/udp Blizzard
6347/udp Gnutella
6348/udp Gnutella
6349/udp Gnutella
6350/udp Gnutella
6355/udp Gnutella
8080/tcp HTTP HTTP-ALT ver puerto 80. Tomcat lo usa como puerto por defecto.
8118/tcp privoxy
9009/tcp Pichat peer-to-peer chat server