0% encontró este documento útil (0 votos)
43 vistas35 páginas

Módulo 2 - Compressed

El módulo 2 del curso de Data Analytics se centra en Microsoft Excel y Google Sheets, enseñando funciones clave para el análisis y manipulación de datos. Los estudiantes aprenderán a importar, organizar, filtrar y procesar datos, así como a realizar cálculos y automatizar tareas. Además, se incluyen instrucciones detalladas para transformar tablas y realizar operaciones como renombrar columnas y reemplazar valores.

Cargado por

saraiyabale
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
43 vistas35 páginas

Módulo 2 - Compressed

El módulo 2 del curso de Data Analytics se centra en Microsoft Excel y Google Sheets, enseñando funciones clave para el análisis y manipulación de datos. Los estudiantes aprenderán a importar, organizar, filtrar y procesar datos, así como a realizar cálculos y automatizar tareas. Además, se incluyen instrucciones detalladas para transformar tablas y realizar operaciones como renombrar columnas y reemplazar valores.

Cargado por

saraiyabale
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Contenido

Curso inicial de Data Analytics

MÓDULO 2: Microsoft Excel

Llegamos al módulo 2, en el mismo aprenderán las funciones y características


clave de Excel que son relevantes para el análisis de datos. Comenzarán por
adquirir conocimientos básicos sobre la interfaz de Excel, incluyendo la
navegación por las hojas de cálculo, la manipulación de celdas y la creación de
fórmulas.

Esta herramienta, además, proporciona a los estudiantes las habilidades


esenciales para el análisis, la visualización y la manipulación de datos, lo que les
permitirá tomar decisiones informadas y eficientes.

a. Introducción a Microsoft Excel

Excel es un programa de hojas de cálculo desarrollado por Microsoft que se utiliza


para almacenar, organizar y analizar datos de manera eficiente. Es una
herramienta muy versátil que se puede implementar en una amplia variedad de
entornos, desde empresas hasta hogares y escuelas.

Algunas de las cosas que se pueden realizar con Excel y bases de datos son:

● Importar y exportar datos: permite importar datos desde diferentes


fuentes, como archivos CSV, bases de datos SQL y fuentes web. También
permite exportar datos a diferentes formatos, como CSV, HTML y PDF.
● Organizar y almacenar datos: permite ingresar grandes cantidades de
datos de manera ordenada y estructurada. Podés utilizar hojas de cálculo
para organizar los datos en tablas y aplicar formato a los encabezados y
celdas para que la información sea fácil de leer y entender.
● Filtrar y buscar datos: permite filtrar y buscar datos en una base de datos
en función de ciertos criterios, lo que facilita la localización de la
información que necesitas.
● Procesar datos/realizar cálculos: tiene una amplia gama de funciones y
herramientas de análisis que permiten realizar cálculos complejos y análisis
de datos. Por ejemplo, se pueden utilizar las funciones de suma, promedio,
máximo, mínimo y contar para realizar cálculos básicos. También se pueden
utilizar herramientas de análisis de datos como gráficos y tablas dinámicas
para visualizar y resumir los datos.
● Automatizar tareas: permite automatizar tareas mediante el uso de
macros y funciones personalizadas. Las macros son secuencias de
comandos que pueden ejecutar tareas repetitivas, mientras que las
funciones personalizadas permiten crear funciones que no están disponibles
en Excel de forma predeterminada.

En este curso haremos hincapié en la lectura, la organización, el filtrado, el


procesamiento y el almacenamiento de datos.

b. Google Sheets

En primer lugar, procedemos a descargar la base de datos de Google Sheets en


formato Excel.

Google Sheets es una herramienta de hojas de cálculo basada en la web,


desarrollada por Google como parte de su suite de aplicaciones de productividad
conocida como Google Workspace (anteriormente G Suite). Es una plataforma
utilizada como alternativa a programas de hojas de cálculo tradicionales como
Microsoft Excel.

Esta interfaz permite a los usuarios crear y editar hojas de cálculo en línea de
forma colaborativa y en tiempo real. Puedes acceder a tus hojas de cálculo desde
cualquier dispositivo con conexión a Internet y compartir tus archivos con otros
usuarios para colaborar en proyectos de forma simultánea.

Al igual que otras aplicaciones de hojas de cálculo, Google Sheets permite realizar
cálculos matemáticos, organizar datos en tablas, crear gráficos y generar
informes. Además, ofrece la capacidad de importar y exportar datos en varios
formatos, como CSV (valores separados por comas) y Excel, lo que facilita la
integración con otras herramientas y sistemas.

En este caso trabajamos con una tabla generada en Google Sheets, la cual deberá
ser descargada como un archivo de Excel para procesar sus registros. Para
completar esta primera acción, sigue estos pasos:

1. Abre la hoja de cálculo de Google Sheets y asegúrate de que la tabla que


deseas descargar esté abierta.
2. Para tener los permisos de edición de la base de datos, haz clic en "Archivo"
en la barra de menú de Google Sheets y luego selecciona "Crear una copia".
Puedes renombrar el archivo y ubicarlo en la carpeta de Drive que desees.
3. Haz clic en "Archivo" en la barra de menú de Google Sheets y luego
selecciona "Descargar" en el menú desplegable.
4. Selecciona "Microsoft Excel" en el menú de opciones que aparece.
5. Haz clic en "Descargar" para iniciar la descarga del archivo.
6. Si prefieres descargar solo una parte de la tabla en lugar de toda la hoja de
cálculo, selecciona las celdas que deseas descargar antes de seguir los
pasos anteriores. Luego, solo se descargará el rango de celdas seleccionado
como archivo de Excel.

En segundo lugar, abrimos el archivo descargado con Microsoft Excel, el cual


contiene datos de ventas de una empresa local de la ciudad de Córdoba.
La base de datos cuenta con las siguientes columnas:

● ID venta: un identificador único para cada venta.

● Cliente: el nombre del cliente que realizó la compra.

● Género: el género del cliente que realizó la compra.

● Edad: la edad del cliente que realizó la compra.

● Fecha venta: la fecha en que se realizó la venta.

● Producto: el nombre del producto vendido.

● Costo unitario: el costo de cada unidad vendida.

● Precio unitario: el precio de cada unidad vendida.

● Cantidad: la cantidad de unidades vendidas.

● IVA: la carga fiscal sobre cada unidad vendida.

● Ciudad destino: la localidad donde se encuentra el cliente.

● País destino: el país donde se encuentra el cliente.

Ejemplo de estructura de una tabla:

ID Fecha Costo Precio Ciudad País


Cliente Género Edad Producto Cantidad IVA
venta venta unitario unitario destino destino
1 Luciano Hombre 49 1/1/2021 Heladera 9000 30000 1 0.21 Córdoba Argentina
2 Marta Mujer 48 1/2/2021 Lavarropas 7500 30000 2 0.21 Córdoba Argentina
3 Lucas Hombre 62 1/3/2021 Cocina 13500 45000 3 0.21 Córdoba Argentina
1- Primeras transformaciones de la tabla de “Ventas”

Convertir datos en tabla.

Para convertir el rango de celdas en una tabla en Excel, sigue estos pasos:

1. Selecciona el rango de celdas que deseas convertir en una tabla.

2. Haz clic en la pestaña "Insertar" en la cinta de opciones de Excel.

3. En el grupo "Tablas", selecciona "Tabla".


4. En el cuadro de diálogo "Crear tabla", asegúrate de que el rango
seleccionado se muestra correctamente en el cuadro de texto "Rango de
datos".
5. Si los datos incluyen encabezados de columna, asegúrate de que la casilla
"Mi tabla tiene encabezados" esté marcada.
6. Haz clic en "Aceptar" para convertir el rango seleccionado en una tabla.

7. Si deseas que la tabla tenga un estilo específico, selecciona uno de los


estilos de tabla en la sección "Estilos de tabla".

8. Si deseas nombrar la tabla, indica su denominación en la sección “Nombre


de la tabla”.
Una vez que el rango de celdas se ha convertido en una tabla, puedes utilizar las
herramientas de tabla adicionales de Excel para trabajar con los datos, como
ordenar y filtrar por columnas, agregar fórmulas y utilizar tablas dinámicas.

También puedes personalizar la apariencia de la tabla y el estilo de formato en


cualquier momento haciendo clic en la tabla para seleccionarla y utilizando las
herramientas de diseño de tabla adicionales que aparecen en la pestaña "Diseño
de tabla" de la cinta de opciones.

Cambiar tipos de datos. Para cambiar el tipo de datos de una celda o rango de
celdas en Excel, sigue estos pasos:
1. Selecciona la celda o rango de celdas que deseas cambiar.

2. Haz clic derecho en la selección y selecciona "Formato de celdas" en el


menú contextual que aparece.

3. En la ventana de "Formato de celdas", selecciona la pestaña "Número".


4. En la sección "Categoría", selecciona el tipo de dato que deseas utilizar. Por
ejemplo, si deseas cambiar el tipo de dato a número, selecciona "Número"
en la lista de categorías.
5. Si es necesario, selecciona un formato específico de valores decimales,
separadores de miles y números negativos, de ser necesario.
6. Haz clic en "Aceptar" para aplicar el nuevo formato a la celda o rango de
celdas. (Pasos 3 al 6 resumido en la siguiente imagen)
7. Si deseas cambiar el tipo de datos de una columna completa, selecciona la
columna haciendo clic en el encabezado de la columna, luego sigue los
mismos pasos descritos anteriormente para cambiar el formato de celda
para la columna completa.

Es importante tener en cuenta que, al cambiar el tipo de datos de una celda o


rango de celdas, es posible que se produzca una pérdida de datos o una
conversión inexacta, especialmente si los datos antiguos no coinciden
exactamente con el nuevo formato de datos. Por lo tanto, es recomendable
realizar una copia de seguridad de los datos antes de cambiar los tipos de datos.

Renombrar columnas. Para cambiar el nombre de una columna, sigue los


siguientes pasos:
1. Haz doble clic en la columna que deseas renombrar para seleccionarla.

2. Escribe el nuevo nombre de la columna en el cuadro de diálogo que aparece


y presiona Enter.

3. Ajusta el tamaño del campo para visualizar el nuevo nombre. Para


asegurarte de que la columna tenga el ancho correcto puedes hacer click
derecho y seleccionar la opción “Ancho de columna”.
4. Lo mismo aplica para cambiar el nombre de la hoja de trabajo. Haz doble
clic en el nombre que aparece en la sección inferior para aplicar este
cambio.

Cambiar o limpiar celdas vacías. Para cambiar o limpiar datos vacíos en Excel,
sigue estos pasos:

1. Selecciona la columna o rango de celdas que contiene los datos vacíos que
deseas cambiar o limpiar.
2. Haz clic en la pestaña "Inicio" en la cinta de opciones de Excel.
Paso 1 y 2

3. Busca el grupo "Edición" y haz clic en "Buscar y seleccionar".


4. Selecciona "Ir a Especial" en el menú desplegable que aparece.

Paso 3 y 4

5. Selecciona "Celdas en blanco" en la ventana "Ir a Especial" y haz clic en


"Aceptar". Esto seleccionará todas las celdas vacías en el rango
seleccionado.
6. Escribe el valor o fórmula que deseas utilizar en lugar de los datos vacíos y
presiona "Ctrl" + "Enter" para aplicar el cambio a todas las celdas
seleccionadas a la vez.
7. Si deseas eliminar completamente los datos vacíos, en lugar de
reemplazarlos, selecciona las celdas vacías y presiona "Eliminar" en el
teclado. Esto eliminará los datos vacíos y desplazará los datos adyacentes
para llenar el espacio vacío.

Paso 6 Y 7

Alternativamente, si deseas eliminar los datos vacíos de una columna o rango de


celdas, también puedes hacerlo utilizando la función "Filtrar". Selecciona la
columna o rango de celdas, haz clic en "Datos" en la cinta de opciones, selecciona
"Filtrar" y luego selecciona "Filtro por valores en blanco". Esto mostrará solo las
celdas vacías en el rango seleccionado, lo que te permitirá eliminarlas fácilmente.
2- Transformaciones adicionales

Tras las primeras transformaciones de la base de datos, avanzamos en otros


procedimientos sobre los registros.

Filtrar datos. Para filtrar datos en Excel, sigue estos pasos:

1. Selecciona la celda que deseas filtrar. Si tienes una tabla, haz clic en
cualquier celda dentro de la tabla.
2. En la fila del encabezado de la columna, haz clic en la flecha hacia abajo en
el extremo derecho.

Paso 1 y 2

3. En el menú desplegable que aparece, selecciona los criterios de filtro que


deseas aplicar a la columna. Puedes elegir mostrar valores específicos,
valores que cumplan con una condición, valores vacíos, etc.
4. Una vez que hayas seleccionado los criterios de filtro, haz clic en "Aceptar"
para aplicar el filtro a la columna.

Paso 3 y 4
5. Repite estos pasos para cada columna que desees filtrar.

6. Para eliminar el filtro, haz clic en la pestaña "Inicio" en la cinta de opciones


de Excel, haz clic en "Ordenar y filtrar" y luego haz clic en "Borrar" para
eliminar el filtro de todas las columnas.
Con los datos filtrados, podrás ver únicamente los valores que cumplan con los
criterios que hayas especificado para cada columna. Además, puedes combinar
varios filtros en diferentes columnas para refinar aún más los resultados que
deseas ver en la tabla.

Reemplazar valores. Para reemplazar valores en Excel, sigue estos pasos:

1. Selecciona el rango de celdas que deseas reemplazar. Si deseas reemplazar


valores en una tabla, haz clic en cualquier celda dentro de la tabla.
2. Haz clic en la pestaña "Inicio" en la cinta de opciones de Excel.

Paso 1 y 2
3. Busca el grupo "Edición", haz clic en "Buscar y reemplazar", y luego en
“Reemplazar”.

4. En el cuadro de diálogo "Buscar y reemplazar", ingresa el valor que deseas


reemplazar en el cuadro "Buscar".
5. En el cuadro "Reemplazar con", ingresa el valor que deseas utilizar como
reemplazo.

Paso 4 y 5

6. Si deseas reemplazar todos los valores que coincidan, haz clic en


"Reemplazar todo". Si solo deseas reemplazar un valor a la vez, haz clic en
"Reemplazar".
7. Repite estos pasos para cada valor que desees reemplazar.

También puedes utilizar opciones avanzadas de reemplazo en Excel, como buscar


valores con formato específico, buscar y reemplazar únicamente en fórmulas o
buscar y reemplazar valores que coincidan con una expresión regular. Para
acceder a estas opciones avanzadas, haz clic en el botón "Opciones >>" en el
cuadro de diálogo "Buscar y reemplazar".

Concatenar columnas. Para concatenar columnas en Excel, es decir, combinar el


contenido de dos o más columnas en una sola, puedes utilizar la función
CONCATENAR o el operador "&". Sigue estos pasos:

1. En una celda en blanco, escribe la fórmula para concatenar las columnas.


Por ejemplo, si deseas combinar el contenido de las columnas K
(Ciudad_destino) y L (País_destino), escribe la fórmula en el campo M.
2. Para utilizar la función CONCATENAR, escribe "=CONCATENAR(" en la celda
M2. Luego, escribe la referencia de la primera celda en la columna K,
seguida de una coma y un espacio, y luego la referencia de la primera celda
en la columna L. Cierra la función CONCATENAR con ")".

3. Otra alternativa: para utilizar el operador "&", escribe la referencia de la


primera celda en la columna K, seguida del operador "&", más una coma y
un espacio, otra "&" y luego la referencia de la primera celda en la columna
L.
4. Presiona Enter para obtener el resultado de la fórmula en la celda M2.
5. Para aplicar la fórmula a todas las filas de la tabla, haz clic en la celda M2
para seleccionarla. Luego, haz clic y arrastra el controlador de relleno en la
esquina inferior derecha de la celda hacia abajo hasta el final de la tabla.

Pasos 4 y 5
Una vez que hayas concatenado las columnas, puedes copiar los resultados y
pegarlos en otra columna o en otra aplicación para su uso.

Generar columnas. Para generar nuevas columnas en una tabla en Excel, sigue
estos pasos:

1. Haz clic derecho en cualquier celda dentro de la tabla para seleccionarla.


2. Selecciona "Insertar" y luego "Agregar columna a la derecha" o "Agregar
columna a la izquierda", según la ubicación en la que desees agregar la
nueva columna.
3. Ingresa el encabezado para la nueva columna y presiona Enter. La nueva
columna aparecerá en la tabla con el encabezado que has ingresado.

4. Si deseas ingresar datos en la nueva columna, haz clic en cualquier celda de


la columna y comienza a escribir o pegar los datos.

5. Si deseas aplicar una fórmula a la nueva columna, haz clic en la primera


celda de la columna y comienza a escribir la fórmula. Luego, arrastra el
controlador de relleno en la esquina inferior derecha de la celda hacia abajo
para aplicar la fórmula a todas las celdas de la columna.

Repite estos pasos para agregar tantas columnas como necesites a la tabla. Si
necesitas eliminar una columna, haz clic derecho en cualquier celda de la columna
que deseas eliminar, selecciona "Eliminar" y por último "Columnas de la tabla". Se
puede eliminar sin problemas la columna de "Ciudad_país" creada en el ejemplo.
3- Normalización de datos

Retomando los beneficios de normalización de la base de datos que vimos en el


módulo 1, cabe resaltar que se trata de un proceso mediante el cual se organizan
y estructuran las tablas para minimizar la redundancia y maximizar la eficiencia de
los datos. En síntesis, con este proceso nos aseguramos de la integridad y
agilizamos la lectura de los registros (se vuelve muy importante cuando
trabajamos con grandes fuentes de información).

Ejemplo de estructura de una tabla normalizada:

● Tabla "Ventas":

ID Fecha Costo Precio Ciudad


Cliente Género Edad Producto Cantidad IVA
venta venta unitario unitario destino
1 Luciano Hombre 49 1/1/2021 Heladera 9000 30000 1 0.21 1
2 Marta Mujer 48 1/2/2021 Lavarropas 7500 30000 2 0.21 1
3 Lucas Hombre 62 1/3/2021 Cocina 13500 45000 3 0.21 1

● Tabla "Ciudades":

ID ciudad Ciudad destino ID país


1 Córdoba 1

● Tabla Países":

ID país País destino


1 Argentina

Procedemos con los pasos a aplicar para normalizar la base de datos de "Ventas".

Identificar atributos. Identifica las dependencias funcionales:

1. Analiza la tabla y determina las relaciones que existen entre las columnas.
2. Las columnas que dependen de otras columnas deben agruparse en una
tabla diferente.
3. A modo de ejemplo, se sombrean en colores los atributos identificados en la
base. Se destacan los valores de clientes, géneros, productos, ciudades y
países.

Pasos 1-2 y 3
Dividir tablas. Separa la tabla central en diferentes entidades según los atributos
identificados. Para esto debemos crear una nueva tabla para cada grupo de
columnas que tengan una relación funcional y colocar cada tabla en una hoja de
cálculo separada.

1. Duplica la tabla central para conservar una entidad con los valores
originales sin modificaciones.

2. Copia las columnas de cada atributo con sus valores, crea una hoja nueva y
pega los valores.
3. Convierte las celdas en tabla y elimina datos duplicados para obtener
registros únicos por atributo.

4. Renombra las hojas con los respectivos nombres de los atributos.


5. En este ejemplo vemos el caso de la tabla de atributos de "Clientes". Se
debería aplicar el mismo proceso para las tablas de género, productos y
ciudades (se debe incluir la columna de países).

Generar valores ID. Para cada tabla, identifica una columna que pueda actuar
como clave primaria única (valor que identifique a cada registro). La clave
primaria se utiliza para señalar valores distintivos y relacionar los datos de la tabla
con otras tablas. En general estos valores son ID, pero también pueden tener el
formato de legajo, número de documento, etc. En este caso, creamos IDs para los
atributos.
1. Haz clic derecho en cualquier celda dentro de la tabla para seleccionarla.
2. Selecciona "Insertar" y luego "Agregar columna a la derecha".

Pasos 1 y 2

3. Ingresa el encabezado para la nueva columna y presiona Enter.

4. Haz clic en la primera celda de la columna y comienza a escribir los datos


de ID (inicia en 1 y aumenta de forma incremental). Este campo será la
clave primaria de la tabla de atributos.
5. Aplica a todos los valores de la columna.

Conectar datos. Tras la generación de tablas de atributos con sus respectivos


valores de identificación única (ID), procedemos a conectar los registros de las
entidades. La idea principal es compartir los diferentes valores ID de atributos (ID
de cliente, ID de producto, ID de ciudad, etc.) a la tabla central, con el objetivo de
optimizar el funcionamiento interno del dataset. Estos campos serán las claves
foráneas de la tabla principal de ventas.

La función BUSCARV en Excel es una función de búsqueda que permite llevar a


cabo esta función, al buscar un valor en una tabla y devolver un valor
correspondiente en la misma fila de la tabla. A continuación se describen los pasos
para utilizar la función BUSCARV en Excel:

1. Abre la hoja de cálculo en la que deseas utilizar la función BUSCARV.

2. Asegúrate de tener una tabla con datos que incluya al menos dos
columnas. La primera columna debe contener los valores de búsqueda y la
segunda columna debe contener los valores que deseas recuperar.
3. Selecciona la celda donde deseas que aparezca el resultado: Esto es donde
aparecerá el valor recuperado de la segunda columna.

Paso 2 y 3

4. Escribe la función BUSCARV: En la barra de fórmulas de Excel, escribe


"=BUSCARV(", seguido del valor de búsqueda que deseas buscar. A
continuación, agrega una coma y selecciona el rango de la tabla que
contiene los valores de búsqueda y los valores que deseas recuperar.
Asegúrate de que la primera columna del rango de la tabla sea la columna
que contiene los valores de búsqueda. Agrega otra coma y especifica el
número de columna de la tabla que contiene el valor que deseas recuperar.
5. Cierra la función: Cierra la función escribiendo un paréntesis cerrado ")" y
presiona Enter para obtener el resultado.

Paso 4 y 5

Por ejemplo, tenemos una tabla de "Ventas" y otra de "Clientes". Se genera la


tabla específica del elemento identificado y también sus registros "ID" para cada
valor único.

En la tabla de Ventas generamos una nueva columna a la derecha para consultar


los valores ID de los clientes (esto es para optimizar el almacenamiento de datos).
La función BUSCARV se vería así: "=BUSCARV([@[Nombre_cliente]];
'Clientes'!A:B; 2; FALSO)".

En este ejemplo:

● "[@[Nombre_cliente]]" es el valor presente en la tabla Venta que deseamos


buscar en la tabla.
● 'Clientes'!A:B es el rango de la tabla Clientes que contiene los valores de
búsqueda (Nombre_cliente para emparejar datos) y los valores que deseas
recuperar (ID_cliente para obtener los valores identificatorios en la tabla
Ventas).
● 2: especifica que deseas recuperar el ID de cliente (es la columna número
dos de la tabla Clientes).
● FALSO: indica que la coincidencia entre los nombres de clientes debe ser
exacta para que se cumpla la conexión (si se marca VERDADERO, la
coincidencia no necesariamente debe ser exacta).

De esta manera, en la tabla "Ventas" se añaden estos "ID" en lugar de los valores
originales. En este sentido, se logra la normalización de los datos entre las tablas.

Ordenar y eliminar columnas. Luego de la normalización de los datos, se inicia el


paso final que incluye el ordenamiento y el descarte de campos de la base. Sigue
estos pasos:

1. Copia y pega los valores (sólo valores) de las columnas IDs importadas a la
tabla "Ventas". Esto es para reemplazar la función BUSCARV y sólo
almacenar los registros ID (para que el valor no arroje error al realizar
cambios en la tabla).
2. Señala el campo a mover, presiona la tecla "SHIFT" y mantiene presionado
el clic mientras colocas en otro lugar de la tabla.

3. Elimina la columna de atributo redundante en la tabla principal. Si cuentas


con el campo "ID_cliente" debes descartar la columna "Nombre_cliente"
(este valor se expande en la tabla específica de clientes).

Normalización de columnas con jerarquía. Tras el ejemplo de normalización del


atributo de género, es propicio aplicar al caso de los datos geográficos ya que
requiere de una lógica y unos pasos adicionales. Debido a la característica
particular de los valores de ciudades y países -teniendo en cuenta que las
ciudades integran a los países y no viceversa-, se torna necesario realizar una
doble normalización de los registros.
En este sentido, la tabla central que, a nivel original, cuenta con los datos de
ambos atributos, debe sufrir modificaciones para sólo contar con los valores de
ciudades. Dado que cada venta se asocia a una ciudad de destino en particular, el
valor de país se obtiene a partir de estos valores de ciudades.

Por ejemplo, si una venta tiene como destino a la ciudad de Córdoba, el valor del
país de destino debe obtenerse a partir de la tabla particular de ciudades,
funcionando de manera “ramificada” o “jerárquica”. La idea es que se enmarque
de menor -ciudades- a mayor -países- nivel de jerarquía en estos casos, así que
al contar con los datos de ciudades (y estos datos conectarse con los de países),
cada venta estará asociada a los países.

Partiendo de la tabla de ventas, se puede generar una tabla adicional de ciudades,


donde se genera el “ID Ciudad” y se asocia cada distrito a un valor de país. Con la
misma lógica, se crea una tabla de países con su propio “ID país”, la cual se
conecta con la tabla central de ventas sólo a través de la tabla de atributos de
ciudades.

Resultado de la normalización de la tabla central con este ejemplo

ID Fecha Costo Precio ID


Cliente Género Edad Producto Cantidad IVA
venta venta unitario unitario Ciudad
1 Luciano Hombre 49 1/1/2021 Heladera 9000 30000 1 0.21 1
2 Marta Mujer 48 1/2/2021 Lavarropas 7500 30000 2 0.21 1
3 Lucas Hombre 62 1/3/2021 Cocina 13500 45000 3 0.21 1

Resultados de las tablas de atributos

● Tabla “Ciudades”:

ID ciudad Ciudad destino ID país


1 Córdoba 1

● Tabla “Países”:

ID país País destino


1 Argentina

Para llevar a cabo este proceso, sigue estos pasos:

1. Aplicar lo realizado con el ejemplo del atributo de género en cuanto a


“identificar atributos”, ”dividir tablas”, ”generar valores ID” y ”conectar
datos”. La única diferencia es que la nueva tabla de ciudades debe crearse
con los valores únicos de cada distrito y, también, con los valores asociados
de países.
2. Una vez aplicada la normalización de los valores de ciudades, se puede
avanzar en la normalización de países. A partir de la tabla de ciudades debe
extraerse la columna de país para generar una tabla nueva de países.

3. Una vez construida, deben aplicarse a los registros de los países los cuatro
pasos aplicados anteriormente a los de ciudades.

Así, desde la tabla central de ventas se conectan los datos con la tabla de
atributos de ciudades y, desde esta última, se enlazan con los de países. Una vez
queda efectuada esta relación “ramificada” entre las tres tablas, los datos
geográficos quedan normalizados eficientemente.
¡Animate a practicar!

Realizar transformaciones en la base de datos utilizando Microsoft Excel.

[Link]
id=236679552

La manipulación de la tabla de Ventas debe incluir:

1. Conversión de las celdas en tabla.


2. Cambio en tipos de datos.
3. Cambio de nombre en columnas.
4. Limpieza de datos vacíos.
5. Filtro de datos.
6. Reemplazo de valores.
7. Generación de columna adicional.
8. Normalización de datos para todos los atributos: clientes, géneros,
productos, ciudades (se relacionan con la tabla principal de ventas) y países
(se relaciona con la tabla de ciudades).

Te dejamos a disposición el video con el resultado final de la base de datos


normalizada con los registros y las tablas de atributos procesadas.

[Link]
647108131

Video de la actividad: [Link]

También podría gustarte