0% encontró este documento útil (0 votos)

31 vistas10 páginas

Depuración de datos en R-Studio

Este documento describe los pasos para depurar una base de datos usando R-Studio. Explica cómo limpiar, segmentar y analizar los datos, reemplazando valores faltantes y creando gráficas para una mejor visualización y análisis de la información.

Cargado por

JONNATHAN ALEJANDRO FAREZ PILLACELA

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

31 vistas10 páginas

Depuración de datos en R-Studio

Cargado por

JONNATHAN ALEJANDRO FAREZ PILLACELA

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Universidad de Cuenca

Facultad de Ciencias Químicas

INFORME: Desarrollo de código para la
depuración de datos

NOMBRE:
Jonnathan Alejandro Farez Pillacela
Profesor/a: Rodrigo Guaman

Ecuador- Azuay-Cuenca
13 de abril del 2024
1

1. TITULO: Depuración de una base de datos.

2. OBJETIVO:

 Evaluar la eficiencia del proceso de depuración de datos en mejorar la integridad,

precisión y accesibilidad de la información contenida en la base de datos, y cómo
esto contribuye a una mejor toma de decisiones dentro de la organización.

3. DESSAROLLO

En la actualidad los datos se que son obtenidos de diferentes actividades y procesos de una
empresa, estos datos deben ser depuradas y revisadas, por la razón de que si los datos están
escritos erróneamente se necesita realizar ajustes y para poder tomar una decisión desde la
base de datos del cual esto dependerá mucho para el progreso de la empresa o fabrica.

En este informe se explicará como depurar una base de datos con el uso de la plataforma de
R-Studio, segmentación de datos y también poder graficar los datos para mayor
entendimiento. Por lo que se basara en los siguientes pasos:

1. Revisamos que el documento este en formato CVS (“delimitado por coma” o “punto y
coma”), lo guardamos el documento en una carpeta donde le sea fácil de recordar.

Para mayor facilidad guardar en la parte del escritorio el documento.

2. Abrimos el R-Studio, creamos una nueva hoja; creamos una variable para guardar datos
del documento; luego escribimos el siguiente código del cual nos permitirá abrir el
documento dentro del R-Studio. Para abrir el documento vamos en la parte izquierda,
en la barrada de datos tocamos “Sesión” la cual nos permite buscar la carpeta en la que
se guardó el documento CSV y aplastamos “Enter” para abrirlo.

Aplastamos la tecla con ”Dos flechas” para abrir la carpeta del escritorio donde está el
documento CSV y lo aplastamos “Enter” para ejecutarlo.
3

Y terminamos de escribir el código y los terminamos con un “summary ( )” que nos

permite guardar los valores que están dentro del documento CVS.

3. Instalamos el paquete llamado de “MICE” y escribimos “Library ( )” para abrir el

paquete para utilizarlo.

4. Creamos una nueva variable secundaria, la cual, escribimos el siguiente código para
segmentar la base de datos y dependiendo de lo que se necesita analizar del documento
principal:
4

5. Eliminamos las celdas que no se necesita o no son necesarios para el análisis de datos,
escribimos un “summary ( )” para poder guardar los ajustes o cambios que se realizan
y lo ejecutamos:

6. En el siguiente código analizamos que variables necesitan ser ajustadas por falta de
valores o por un mal ingreso de aquellos datos, y en este código ponemos condiciones
para arreglar y no tener problemas, a esos valores que faltan son sustituidos por un
“NA” y los guardamos con un “summary ( )”.
5

7. Instalamos el paquete llamado “modeest” y lo abrimos utilizando un “library” para

ejecutarlo que nos permitirá realizar cálculos de la media aritmética, mediana y moda,
esto se usa por la razón que al tener varios o miles de datos es difícil de realizar estos
cálculos.

8. Una vez ejecutada el paquete, escribimos el siguiente código; en el cual, el código nos
permitirá que las variables que contienen los “NA” por falta de valores, sean sustituidos
por un valor obtenido de la media aritmética, mediana o la moda del total de datos que
6

se tiene en la base de datos y guardamos los datos con un “summary ( )” para no

perderlos y después poderlos analizar.

9. Instalamos el siguiente paquete llamado “fdth” para graficar o tabular datos en una
grafica.

10. Creamos una nueva variable llamado “dist” para poder recoger los valores de la base de
datos y poder representarle en una tabla de valores más simple. Y los ejecutamos con
“ctrl + enter”.
7

Dentro de esta variable se puede encontrar los diferentes valores que se encuentran en la
base de datos y todos aquellos que fueron ajustados o depurados. Estos valores nos
permitirán poder graficar.

11. Escribimos el siguiente código que nos permitirá utilizar los valores de la tabla y poder
mostrar una gráfica que se obtuvo de todo el proceso de depuración y análisis. Esto
valores serán tomadas de la segunda variable creada.
8

12. Por último, el siguiente código ayuda a realizar comparaciones entre dos tablas
diferentes con diferentes datos.

Esta tabla de valores nos permitirá realizar análisis y comparaciones entre dos temas o
categorías diferentes y poder tomar decisiones que puedan beneficiar a la empresa y si
un error se comete, toda la base de datos mostrara diferentes valores que nos son reales
a la realidad y puede llevar a la quiebra de la misma.

Hay que tomar en cuenta si falta una comilla, signo, punto u otro signo puede enviar a error
del sistema ya que no puede leer, este programa es muy utilizado en diferentes empresas o
trabajos con el fin de realizar análisis eficientes de una base de datos.
9

4. CONCLUSIONES

 La depuración de una base de datos es un proceso crucial en la programación con R-

Studio; lo cual, permite limpiar el código de errores para que se pueda ejecutar con
éxito. Los errores o problemas pueden surgir automáticamente después de la
compilación del código y pueden ser difíciles de diagnosticar.

 Hay que tomar en cuenta que arreglar los errores lleva mucho tiempo y después de
múltiples niveles de practica se podrá mejorar; por lo que, la depuración en R se
practica y se aprende a través de advertencias, mensajes y errores.

 Dentro de este programa hay muchos programas que son necesarios de instalar y se
pueden aplicar dentro del mismo; es decir, que, con las librerías adecuadas,
podemos realizar exploraciones de datos eficientes y crear visualizaciones
impactantes que son útiles.

 Podemos decir que R y R-Studio son herramientas poderosas para el análisis de una
base de datos de grandes cantidades recopiladas durante largos periodos.

FIRMA DEL ESTUDIANTE

………Jonnathan.Farez………

También podría gustarte

Informe de Programacion en R Studio
Aún no hay calificaciones
Informe de Programacion en R Studio
10 páginas
Notas de Clase
Aún no hay calificaciones
Notas de Clase
32 páginas
Implementación de Proyecto en RStudio
Aún no hay calificaciones
Implementación de Proyecto en RStudio
30 páginas
Limpieza de Datos
Aún no hay calificaciones
Limpieza de Datos
16 páginas
Depuración de datos en R-Studio
Aún no hay calificaciones
Depuración de datos en R-Studio
3 páginas
Sesion 2
Aún no hay calificaciones
Sesion 2
12 páginas
Sintaxis
Aún no hay calificaciones
Sintaxis
3 páginas
Limpieza y Tratamiento de Datos en R
Aún no hay calificaciones
Limpieza y Tratamiento de Datos en R
7 páginas
Edición y Limpieza de Datos en Rstudio
Aún no hay calificaciones
Edición y Limpieza de Datos en Rstudio
25 páginas
Análisis de Datos en R: Guía Completa
Aún no hay calificaciones
Análisis de Datos en R: Guía Completa
21 páginas
Introduccion A R Studio
Aún no hay calificaciones
Introduccion A R Studio
4 páginas
Introducción al Análisis Estadístico con R
Aún no hay calificaciones
Introducción al Análisis Estadístico con R
41 páginas
Guía Resumen Rstudio Unidad I
Aún no hay calificaciones
Guía Resumen Rstudio Unidad I
16 páginas
Limpieza y Transformación de Datos en Python y R
Aún no hay calificaciones
Limpieza y Transformación de Datos en Python y R
10 páginas
Análisis de Datos: Métodos y Herramientas
Aún no hay calificaciones
Análisis de Datos: Métodos y Herramientas
9 páginas
Datos Con R PDF
100% (2)
Datos Con R PDF
147 páginas
R - Estudio
Aún no hay calificaciones
R - Estudio
43 páginas
Ev2 Decisiones
Aún no hay calificaciones
Ev2 Decisiones
10 páginas
RParaAnalisisDeDatos PDF
Aún no hay calificaciones
RParaAnalisisDeDatos PDF
32 páginas
Introducción A R
Aún no hay calificaciones
Introducción A R
67 páginas
Resumen Curso R
Aún no hay calificaciones
Resumen Curso R
7 páginas
Actividad 2 EDA Práctica
Aún no hay calificaciones
Actividad 2 EDA Práctica
19 páginas
Análisis de Datos con R en Estadística
Aún no hay calificaciones
Análisis de Datos con R en Estadística
8 páginas
Rogelio Notas R
Aún no hay calificaciones
Rogelio Notas R
116 páginas
Gestión de Datos y ETL en R
Aún no hay calificaciones
Gestión de Datos y ETL en R
44 páginas
Lenguaje R
Aún no hay calificaciones
Lenguaje R
4 páginas
Preparación y Depuración de Datos
Aún no hay calificaciones
Preparación y Depuración de Datos
5 páginas
IN 01 Titulo. Apellido Nombre
Aún no hay calificaciones
IN 01 Titulo. Apellido Nombre
8 páginas
Clase 1 Inducción Instalacion R
Aún no hay calificaciones
Clase 1 Inducción Instalacion R
59 páginas
Metodologías de Analítica de Datos MBA
Aún no hay calificaciones
Metodologías de Analítica de Datos MBA
11 páginas
Guía de Instalación y Uso de R y RStudio
Aún no hay calificaciones
Guía de Instalación y Uso de R y RStudio
90 páginas
Temas
Aún no hay calificaciones
Temas
1 página
Exploración de La Base de Datos
Aún no hay calificaciones
Exploración de La Base de Datos
20 páginas
Guía Completa del Software R para Estadística
Aún no hay calificaciones
Guía Completa del Software R para Estadística
19 páginas
Limpieza y Transformación de Datos en Python
Aún no hay calificaciones
Limpieza y Transformación de Datos en Python
70 páginas
Introducción a R: Operaciones y Gráficos
Aún no hay calificaciones
Introducción a R: Operaciones y Gráficos
11 páginas
Cap 9
Aún no hay calificaciones
Cap 9
15 páginas
Guía Completa sobre Análisis de Datos
Aún no hay calificaciones
Guía Completa sobre Análisis de Datos
18 páginas
Procesamiento de Datos Censales Usando R Abel Olivares - JUN.25 - Estación Lastarria
Aún no hay calificaciones
Procesamiento de Datos Censales Usando R Abel Olivares - JUN.25 - Estación Lastarria
3 páginas
Ecctt Tema 1
Aún no hay calificaciones
Ecctt Tema 1
54 páginas
ARTICULO
Aún no hay calificaciones
ARTICULO
4 páginas
Programación en R para Análisis de Datos
Aún no hay calificaciones
Programación en R para Análisis de Datos
11 páginas
Introducción a R con RStudio Server
100% (3)
Introducción a R con RStudio Server
90 páginas
Análisis de Datos en R para Ingeniería
Aún no hay calificaciones
Análisis de Datos en R para Ingeniería
9 páginas
Introducción a la Programación en R
Aún no hay calificaciones
Introducción a la Programación en R
4 páginas
Guía de R para Estadística Computacional
Aún no hay calificaciones
Guía de R para Estadística Computacional
99 páginas
Cruce y Manipulación de Ficheros en R
Aún no hay calificaciones
Cruce y Manipulación de Ficheros en R
65 páginas
Guía para Usar R
Aún no hay calificaciones
Guía para Usar R
16 páginas
Referente Pensamiento Eje 1
Aún no hay calificaciones
Referente Pensamiento Eje 1
21 páginas
Guía Programación Estadística Con R
Aún no hay calificaciones
Guía Programación Estadística Con R
162 páginas
Introducción a Estadística en R
Aún no hay calificaciones
Introducción a Estadística en R
99 páginas
Diseño y carga de base de datos SQL
Aún no hay calificaciones
Diseño y carga de base de datos SQL
8 páginas
Analista de Datos y Desarrollador Web
Aún no hay calificaciones
Analista de Datos y Desarrollador Web
2 páginas
Introduccion Al Analisis de Datos
Aún no hay calificaciones
Introduccion Al Analisis de Datos
2 páginas
Guía de Especialización en Análisis de Datos para Contadores e Ingenieros Industriales
Aún no hay calificaciones
Guía de Especialización en Análisis de Datos para Contadores e Ingenieros Industriales
5 páginas
Introducción a R para Análisis de Datos
Aún no hay calificaciones
Introducción a R para Análisis de Datos
23 páginas
Aplicacion Capa Lim. Ter
Aún no hay calificaciones
Aplicacion Capa Lim. Ter
7 páginas
Flujo de Efectivo Duplicado
Aún no hay calificaciones
Flujo de Efectivo Duplicado
8 páginas
Aplicaciones de termómetros industriales
Aún no hay calificaciones
Aplicaciones de termómetros industriales
1 página
Aplicacion de Un Fluido
Aún no hay calificaciones
Aplicacion de Un Fluido
1 página
Aplicaciones del Método Runge-Kutta
Aún no hay calificaciones
Aplicaciones del Método Runge-Kutta
4 páginas
Universidad de Cuenca
Aún no hay calificaciones
Universidad de Cuenca
2 páginas
Estabilidad de Estructuras Cilíndricas bajo Presión
Aún no hay calificaciones
Estabilidad de Estructuras Cilíndricas bajo Presión
1 página
Universidad de Cuenca
Aún no hay calificaciones
Universidad de Cuenca
2 páginas
Trabajo de Estadistica
Aún no hay calificaciones
Trabajo de Estadistica
13 páginas
Ordenamiento con Árbol Binario en Python
Aún no hay calificaciones
Ordenamiento con Árbol Binario en Python
10 páginas
Demostración de la Ley de Charles
Aún no hay calificaciones
Demostración de la Ley de Charles
5 páginas
Programa de Arbol Binario
Aún no hay calificaciones
Programa de Arbol Binario
6 páginas
Lenguajes de Programacion
Aún no hay calificaciones
Lenguajes de Programacion
172 páginas
Diseño de Sistemas de Producción
Aún no hay calificaciones
Diseño de Sistemas de Producción
22 páginas
Tipos de Procesos de Producción en Empresas
Aún no hay calificaciones
Tipos de Procesos de Producción en Empresas
14 páginas
Importancia del diagnóstico estratégico
Aún no hay calificaciones
Importancia del diagnóstico estratégico
3 páginas
Ejemplo Informe Final
100% (1)
Ejemplo Informe Final
3 páginas
Resumen Tecnico MapReduce Completo
Aún no hay calificaciones
Resumen Tecnico MapReduce Completo
5 páginas
Letra de "Qué Linda Flor"
Aún no hay calificaciones
Letra de "Qué Linda Flor"
2 páginas
Convocatoria Campus Cancun 2024
Aún no hay calificaciones
Convocatoria Campus Cancun 2024
1 página
Planificación y Producción de Eventos
Aún no hay calificaciones
Planificación y Producción de Eventos
39 páginas
Matriz FODA LICEO DE POTRERO
100% (2)
Matriz FODA LICEO DE POTRERO
2 páginas
en Es
100% (1)
en Es
17 páginas
Akose Remedios Tradicionais-1
83% (18)
Akose Remedios Tradicionais-1
106 páginas
Demóstenes: Política y Libertad en Grecia
Aún no hay calificaciones
Demóstenes: Política y Libertad en Grecia
310 páginas
Estrategias para Mejorar la Cartera de Clientes
Aún no hay calificaciones
Estrategias para Mejorar la Cartera de Clientes
17 páginas
Tablas Dinámicas y Reportes en Excel
Aún no hay calificaciones
Tablas Dinámicas y Reportes en Excel
5 páginas
Análisis de la economía de El Salvador
Aún no hay calificaciones
Análisis de la economía de El Salvador
4 páginas
Crecemos y Cambiamos SESIÓN
Aún no hay calificaciones
Crecemos y Cambiamos SESIÓN
4 páginas
La Sabiduría Todo Lo Sabe y Lo Entiende
Aún no hay calificaciones
La Sabiduría Todo Lo Sabe y Lo Entiende
2 páginas
Berro con Leche para Gastritis Keto
Aún no hay calificaciones
Berro con Leche para Gastritis Keto
2 páginas
Situación Política de la Península Ibérica
Aún no hay calificaciones
Situación Política de la Península Ibérica
21 páginas
Perfil Profesional de Inspector END
Aún no hay calificaciones
Perfil Profesional de Inspector END
7 páginas
Contexto Histórico de la Arquitectura Gótica
Aún no hay calificaciones
Contexto Histórico de la Arquitectura Gótica
6 páginas
Eficiencia en Conversión de Energía Térmica
Aún no hay calificaciones
Eficiencia en Conversión de Energía Térmica
34 páginas
Diseño Bibliografico
60% (5)
Diseño Bibliografico
22 páginas
Análisis de Datos de Encuestas y Tiempos
Aún no hay calificaciones
Análisis de Datos de Encuestas y Tiempos
18 páginas
Análisis Financiero en Manufactura Asturias
Aún no hay calificaciones
Análisis Financiero en Manufactura Asturias
3 páginas
Programa Curricular de Educación Básica Alternativa
Aún no hay calificaciones
Programa Curricular de Educación Básica Alternativa
130 páginas
CUADERNOS DESDE CERO Nº 1 A 6 PDF
Aún no hay calificaciones
CUADERNOS DESDE CERO Nº 1 A 6 PDF
102 páginas
Quimiotaxis Bacteriana: Práctica 1
Aún no hay calificaciones
Quimiotaxis Bacteriana: Práctica 1
16 páginas
Liquidación de Sueldos: Normativa y Obligaciones
Aún no hay calificaciones
Liquidación de Sueldos: Normativa y Obligaciones
80 páginas
Protocolo Evaluación Efectividad de Manejo Del Bioma Amazónico - Ecuador
Aún no hay calificaciones
Protocolo Evaluación Efectividad de Manejo Del Bioma Amazónico - Ecuador
60 páginas
Diseño y Tipos de Estudio
Aún no hay calificaciones
Diseño y Tipos de Estudio
18 páginas