0% encontró este documento útil (0 votos)
39 vistas22 páginas

Tiempo de Desencriptación de Contraseñas

Cargado por

bakxzi
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
39 vistas22 páginas

Tiempo de Desencriptación de Contraseñas

Cargado por

bakxzi
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Bachillerato Internacional

Trabajo de exploración

Matemática: Análisis y enfoques NM

¿Cuánto tiempo se requiere para que una computadora desencripte contraseñas

con distintos grados de seguridad?

Código del alumno:

Convocatoria xxxx
Introducción

La mayoría de la información en línea se considera privada y se supone que

solo el propietario debe acceder a ella. Ejemplos de datos protegidos

incluyen cuentas de redes sociales, detalles confidenciales de la empresa y

registros de clientes individuales. Para salvaguardar esta información, las

contraseñas son el método de seguridad más comúnmente utilizado. A

pesar de esto, algunas personas no respetan la privacidad de la información

y buscan apropiársela por diversas razones, siendo la más común el

beneficio personal. Por lo tanto, es esencial que las personas aprendan a

proteger su información de manera efectiva y minimizar la exposición a

posibles hackers malintencionados. Sin embargo, lamentablemente, incluso

contraseñas relativamente complejas, que incluyen ocho caracteres con

letras mayúsculas, minúsculas, números y caracteres especiales, pueden

ser descifradas en tan solo ocho horas por un hacker promedio. Si la

contraseña tiene menos de ocho caracteres, su descifrado puede ocurrir aún

más rápido, a veces de inmediato o en cuestión de minutos.

Una contraseña que consta de menos de ocho caracteres puede ser descifrada

de manera aún más rápida, a veces de forma instantánea o en cuestión de

minutos, como se señala en la obra de Huddleston. Como un entusiasta

programador, he desarrollado numerosos sitios web que requieren cifrado y

protección de la información del usuario. Además, siempre me ha interesado

profundamente el campo de la ciberseguridad y el enfoque ético en el hacking,

habiendo experimentado con el acceso no autorizado a cuentas de redes

sociales y juegos en el pasado.

Dado este contexto, considero que esta investigación de naturaleza matemática

tiene una gran relevancia en el mundo actual. En este estudio, mi primera tarea
será establecer una definición matemática para una contraseña que sea

considerada difícil de descifrar, y lo haré mediante la formulación de una ecuación

que permita evaluar su nivel de seguridad. Posteriormente, procederé a calcular el

tiempo requerido para descifrar contraseñas que posean diferentes niveles de

seguridad. Además, analizaré dos enfoques distintos en situaciones prácticas de

hackeo y determinaré cuál de ellos resulta más efectivo en diferentes contextos. A

modo de extensión, llevaré a cabo una investigación sobre la probabilidad de

descifrar la contraseña de una cuenta de Instagram, dado que este servicio goza

de gran popularidad entre los adolescentes.

Existen múltiples enfoques para llevar a cabo ataques de piratería, no obstante,

esta investigación se concentrará exclusivamente en dos de ellos. El primero, y

quizás el más comúnmente empleado, es el método de ataque de fuerza bruta,

que intenta adivinar la contraseña probando todas las combinaciones concebibles

de caracteres. El segundo método abordado es el ataque de diccionario, el cual

hace uso de una lista predefinida de opciones completas provenientes de un

diccionario, que se cree que podrían funcionar, en lugar de explorar

exhaustivamente todas las combinaciones posibles. La elección de estos dos

enfoques se basa en su aptitud para ser analizados mediante conceptos de

matemáticas puras. Otros métodos más avanzados, como el uso de virus o

keyloggers, requerirían un conocimiento informático más extenso, lo cual se aleja

del propósito de esta investigación de naturaleza matemática

La Matemática del IB, con una visión exploratoria motivó plantear la interrogante:

“¿Cuánto tiempo se requiere para que una computadora desencripte contraseñas con

diferentes grados de seguridad? Haciendo uso del método de los mínimos cuadrados

y la construcción de una función de regresión lineal, el objetivo planteado fue


identificar el nivel de influencia del crecimiento poblacional en el Perú respecto

al Producto Bruto Interno en la


Economía Nacional entre los años 1950 al 2021, concluyendo que la relación es

directamente proporcional. El estudio de los datos recogidos y el análisis operativo

tecnológico explica y fundamenta esta conclusión.

Marco Teórico

 Producto Bruto Interno

El Ministerio de Economía y Finanzas – MEF del Perú, en su portal virtual “Conoce los

conceptos básicos para comprender la economía del país”, define al PBI: “El valor

monetario de los bienes y servicios finales producidos por una economía en un periodo

determinado” (Ministerio de Economía y Finanzas del Perú, s.f.). Se divide en el valor

agregado, la falta de contabilización de las variaciones de los inventarios y la población

adentro de las fronteras en una economía, calculándose mediante los métodos de gasto,

valor agregado e ingreso.

 Crecimiento Poblacional

El crecimiento poblacional se define: “El incremento en el número de individuos

pertenecientes a un determinado ámbito en un año concreto” (Instituto Nacional de

Estadística del Perú, s.f.). Por ello, se entiende como el incremento de personas

habitantes de un espacio y tiempo que ya está determinado, precisándose en los seres

humanos. El registro de ello es importancia vital en las políticas gubernamentales para

la distribución de sus recursos y enfrentar las necesidades sociales.

 Análisis Bidimensional

El análisis bidimensional viene a ser: “Una forma clara de la relación, más o menos

fuerte, que hay entre los valores de dos variables observadas sobre un
mismo individuo” (Galdós, 2005, p. 329). En la investigación, se ha realizado el

análisis bidimensional para relacionar ambas variables.

 Diagrama de dispersión

El diagrama de dispersión es un cuadro el cual se utiliza para: “La investigación de

posibles relaciones entre dos variables relacionadas con un mismo suceso” (Buchanan

et al, 2015, p. 334). En el marco práctico, se muestra el diagrama de dispersión para la

función de regresión entre las variables.

 Recta de regresión

La recta de regresión se utiliza para: “Ubicar la dirección y mostrar la tendencia entre

dos variables” (Buchanan et al, 2015). Se estimó usando las fórmulas:


𝑛 ∑ 𝑥𝑦 − ∑ 𝑥.∑ 𝑦 ∑ 𝑦−𝑎 ∑ 𝑥
𝑎= y𝑏= . En el análisis, se grafica la recta de regresión
𝑛 ∑ 𝑥2 −(∑ 𝑥)2 𝑛

lineal 𝑦 = 𝑎𝑥 + 𝑏.

 Mínimos Cuadrados

El método de los mínimos cuadrados consiste: “Determinar una recta tal que la suma

de los cuadrados de las distancias de la figura sea mínima” (Galdós, 2005, p. 350). Es

el método preciso para obtener una recta, la cual pueda ajustarse de una manera más

adecuada a los puntos necesarios. Su naturaleza se relaciona con la estimación, con

mayor dificultad en el cálculo. Este método, ajusta la recta de los datos recaudados

en el plano coordenado de magnitudes matemáticas. Los datos en un plano

coordenado vendrían a ser las variables x e y, relacionándose entre sí, precisando la

variación de x en función de y. El cuadro 1 hará muestra de la relación de ambas

variables:

CUADRO N° 1: RELACIÓN DE LAS VARIABLES DE INVESTIGACIÓN.

𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 …. 𝑥𝑛
𝑦1 𝑦2 𝑦3 𝑦4 𝑦5 …. 𝑦𝑛

Fuente: Relación de proporción de magnitudes matemáticas (Hurtado, s.f.)

La relación entre ambas variables se muestra a través de la expresión lineal

𝑦 = 𝑎𝑥 + 𝑏, proporcionando criterios para obtener la recta de aproximación de los datos

que representan los elementos de las magnitudes. En la investigación, se realizó el

ajuste de la función de regresión.

 Coeficiente de Relación

Es el factor de la pendiente de la recta que representa la función de regresión lineal,

brindando información sobre el comportamiento de la variable Y en

contra de la variable X, de la siguiente descripción: Si 𝑏𝑌 = 0, para cualquier


⁄𝑋

valor que tome la variable X, la variable respuesta Y es constante. Si 𝑏𝑌 > 0,


⁄𝑋

esto indica que al aumentar el valor que tome la variable X, también se registrará un

aumento en la variable respuesta Y. Si 𝑏𝑌 < 0, esto indica que



𝑋

al aumentar el valor que tome la variable X, se registrará una disminución en la

variable respuesta Y.

 Correlación de Pearson

La correlación de Pearson se define como: “El método más común de determinar si

existe asociación lineal entre dos variables cuantitativas


𝑠𝑋𝑌
continuas” (Camacho, 2008). Su ecuación específica es: 𝑟 = , y
𝑠𝑋.𝑠𝑌

𝑟2 representa el coeficiente de determinación. Asimismo, r no tiene dimensiones y

toma valores entre [−1, 1], pero, si las variables de x son independientes, 𝑟 = 0.

Permitió identificar la confiabilidad en la asociación lineal de las variables.

 Derivadas Parciales
Las derivadas parciales, se definen como: “Nos dan información sobre cómo cambia la

función al variar únicamente una de las dos variables, lo que simplifica su cálculo”

(Gómez & López, 2017, pág. 163). Las ecuaciones diferenciales ordinarias en las

cuales se aplican derivadas, se orientan a la regresión de funciones lineales

dependientes una de otra, teniendo en cuenta el valor de la pendiente (creciente o

decreciente), el intercepto con el eje “y”, los coeficientes de dispersión, correlación y

de regresión. Se aplicó en la investigación para comprobar la validez de la recta de

regresión.

Marco Práctico

En la investigación se pueden identificar las siguientes variables de estudio:

CUADRO N° 2: DESCRIPCIÓN DE LAS VARIABLES DE INVESTIGACIÓN.

Crecimiento Poblacional en el Perú entre los años 1950 al 2021.

Variable Tipo de Variable: Cuantitativa, con valores discretos y enteros positivos. Unidades:

Independiente Número de Personas.

Producto Bruto Interno en la Economía Nacional entre los años 1950 al 2021.

Variable Tipo de Variable: Cuantitativa, con valores discretos y enteros positivos.

Dependiente Unidades: Millones de Soles.

:
Fuente: Elaborado por el investigador en Word para la realización del informe.

(25/06/2022)

La Hipótesis de la investigación es: “El Crecimiento Poblacional en el Perú está

relacionado de forma proporcional al Producto Bruto Interno en la Economía Nacional

entre los años 1950 al 2021”.


En la investigación, se realizó un análisis dimensional de los datos para analizar la

relación de las variables y un diagrama de dispersión, utilizando los programas de

Minitab, Excel y la calculadora Casio fx-CG50. Se ha tomado la información editada de

la fuente “PANORAMA DE LA ECONOMÍA PERUANA 1950 – 2021” que permitió

elaborar el siguiente cuadro:

CUADRO N° 3: INDICADORES ESTADÍSTICOS APLICADOS EN EL METODO DE


LOS MINIMOS CUADRADS – ERRORES ESTIMADOS.

X: Crecimiento
Poblacional Y: Producto Bruto (b+mx-
Año X^2 Y^2 X.Y
(Número de Interno (Soles: S/) y)^2
personas)
1950 7632460 40,920,000,000.00 5.82544E+13 1.67E+21 3.12E+17 6.04E+20
1951 7826262 44,711,000,000.00 6.12504E+13 2.00E+21 3.50E+17 6.37E+20
1952 8025721 47,347,000,000.00 6.44122E+13 2.24E+21 3.80E+17 6.09E+20
1953 8232177 50,085,000,000.00 6.77687E+13 2.51E+21 4.12E+17 5.80E+20
1954 8446997 52,762,000,000.00 7.13518E+13 2.78E+21 4.46E+17 5.43E+20
1955 8671541 55,858,000,000.00 7.51956E+13 3.12E+21 4.84E+17 5.20E+20
1956 8904891 58,484,000,000.00 7.92971E+13 3.42E+21 5.21E+17 4.69E+20
1957 9146156 62,371,000,000.00 8.36522E+13 3.89E+21 5.70E+17 4.70E+20
1958 9396690 61,706,000,000.00 8.82978E+13 3.81E+21 5.80E+17 2.88E+20
1959 9657833 63,653,000,000.00 9.32737E+13 4.05E+21 6.15E+17 2.17E+20
1960 9930965 69,946,000,000.00 9.86241E+13 4.89E+21 6.95E+17 2.76E+20
1961 10217475 75,085,000,000.00 1.04397E+14 5.64E+21 7.67E+17 2.94E+20
1962 10516454 82,620,000,000.00 1.10596E+14 6.83E+21 8.69E+17 3.95E+20
1963 10825811 86,196,000,000.00 1.17198E+14 7.43E+21 9.33E+17 3.41E+20
1964 11143427 91,840,000,000.00 1.24176E+14 8.43E+21 1.02E+18 3.61E+20
1965 11467225 97,003,000,000.00 1.31497E+14 9.41E+21 1.11E+18 3.60E+20
1966 11796313 104,995,000,000.00 1.39153E+14 1.10E+22 1.24E+18 4.69E+20
1967 12132121 109,040,000,000.00 1.47188E+14 1.19E+22 1.32E+18 4.12E+20
1968 12475921 109,206,000,000.00 1.55649E+14 1.19E+22 1.36E+18 2.23E+20
1969 12829004 113,044,000,000.00 1.64583E+14 1.28E+22 1.45E+18 1.72E+20
1970 13192677 116,849,000,000.00 1.74047E+14 1.37E+22 1.54E+18 1.22E+20
1971 13567714 122,213,000,000.00 1.84083E+14 1.49E+22 1.66E+18 1.08E+20
1972 13953235 126,463,000,000.00 1.94693E+14 1.60E+22 1.76E+18 7.11E+19
1973 14348084 134,401,000,000.00 2.05868E+14 1.81E+22 1.93E+18 1.00E+20
1974 14751106 147,017,000,000.00 2.17595E+14 2.16E+22 2.17E+18 2.61E+20
1975 15161146 153,340,000,000.00 2.2986E+14 2.35E+22 2.32E+18 2.52E+20
1976 15580807 155,559,000,000.00 2.42762E+14 2.42E+22 2.42E+18 1.29E+20
1977 16010843 156,102,000,000.00 2.56347E+14 2.44E+22 2.50E+18 2.47E+19
1978 16447370 151,977,000,000.00 2.70516E+14 2.31E+22 2.50E+18 3.82E+19
1979 16886456 158,194,000,000.00 2.85152E+14 2.50E+22 2.67E+18 4.94E+19
1980 17324179 167,596,000,000.00 3.00127E+14 2.81E+22 2.90E+18 2.18E+19
1981 17760219 176,901,000,000.00 3.15425E+14 3.13E+22 3.14E+18 5.65E+18
1982 18197198 176,507,000,000.00 3.31138E+14 3.12E+22 3.21E+18 9.61E+19
1983 18635588 158,136,000,000.00 3.47285E+14 2.50E+22 2.95E+18 1.24E+21
1984 19075874 163,842,000,000.00 3.63889E+14 2.68E+22 3.13E+18 1.34E+21
1985 19518555 167,219,000,000.00 3.80974E+14 2.80E+22 3.26E+18 1.63E+21
1986 19965797 182,981,000,000.00 3.98633E+14 3.35E+22 3.65E+18 1.01E+21
1987 20417262 200,778,000,000.00 4.16865E+14 4.03E+22 4.10E+18 4.51E+20
1988 20869717 181,822,000,000.00 4.35545E+14 3.31E+22 3.79E+18 2.25E+21
1989 21319883 159,436,000,000.00 4.54537E+14 2.54E+22 3.40E+18 5.95E+21
1990 21764515 151,492,000,000.00 4.73694E+14 2.29E+22 3.30E+18 8.50E+21
1991 22203932 154,854,000,000.00 4.93015E+14 2.40E+22 3.44E+18 9.20E+21
1992 22640305 154,017,000,000.00 5.12583E+14 2.37E+22 3.49E+18 1.08E+22
1993 23073150 162,093,000,000.00 5.3237E+14 2.63E+22 3.74E+18 1.05E+22
1994 23501974 182,044,000,000.00 5.52343E+14 3.31E+22 4.28E+18 8.03E+21
1995 24242600 195,536,000,000.00 5.87704E+14 3.82E+22 4.74E+18 7.75E+21
1996 24689213 201,009,000,000.00 6.09557E+14 4.04E+22 4.96E+18 8.05E+21
1997 25145317 214,028,000,000.00 6.32287E+14 4.58E+22 5.38E+18 7.07E+21
1998 25592876 213,190,000,000.00 6.54995E+14 4.54E+22 5.46E+18 8.48E+21
1999 26013829 216,377,000,000.00 6.76719E+14 4.68E+22 5.63E+18 9.16E+21
2000 26390142 222,207,000,000.00 6.9644E+14 4.94E+22 5.86E+18 9.20E+21
2001 26714547 223,580,000,000.00 7.13667E+14 5.00E+22 5.97E+18 9.95E+21
2002 26999085 235,773,000,000.00 7.28951E+14 5.56E+22 6.37E+18 8.49E+21
2003 27254632 245,593,000,000.00 7.42815E+14 6.03E+22 6.69E+18 7.47E+21
2004 27492091 257,770,000,000.00 7.55815E+14 6.64E+22 7.09E+18 6.10E+21
2005 27722342 273,971,000,000.00 7.68528E+14 7.51E+22 7.60E+18 4.30E+21
2006 27934784 294,598,000,000.00 7.80352E+14 8.68E+22 8.23E+18 2.34E+21
2007 28122158 319,693,000,000.00 7.90856E+14 1.02E+23 8.99E+18 6.91E+20
2008 28300372 348,870,000,000.00 8.00911E+14 1.22E+23 9.87E+18 2.07E+23
2009 28485319 352,693,000,000.00 8.11413E+14 1.24E+23 1.00E+19 7.63E+17
2010 28692915 382,081,000,000.00 8.23283E+14 1.46E+23 1.10E+19 7.25E+20
2011 28905725 406,256,000,000.00 8.35541E+14 1.65E+23 1.17E+19 2.27E+21
2012 29113162 431,199,000,000.00 8.47576E+14 1.86E+23 1.26E+19 4.80E+21
2013 29341346 456,435,000,000.00 8.60915E+14 2.08E+23 1.34E+19 8.25E+21
2014 29616414 467,308,000,000.00 8.77132E+14 2.18E+23 1.38E+19 9.47E+21
2015 29964499 482,506,000,000.00 8.97871E+14 2.33E+23 1.45E+19 1.14E+22
2016 30422831 501,581,000,000.00 9.25549E+14 2.52E+23 1.53E+19 1.41E+22
2017 30973992 514,215,000,000.00 9.59388E+14 2.64E+23 1.59E+19 1.50E+22
2018 31562130 534,626,000,000.00 9.96168E+14 2.86E+23 1.69E+19 1.78E+22
2019 32131400 546,605,000,000.00 1.03243E+15 2.99E+23 1.76E+19 1.85E+22
2020 32625948 486,737,000,000.00 1.06445E+15 2.37E+23 1.59E+19 4.67E+21
2021 33035304 551,714,000,000.00 1.09133E+15 3.04E+23 1.82E+19 1.61E+22
 1.42E+09 1.50E+13 3.25678E+16 4.56E+24 3.68E+20 4.90E+23
Fuente: Editado por el investigador para la realización del informe. (25/06/2022)
(Instituto Nacional de Estadística e Informática, 2022)
Con estos datos, se realizó un diagrama de dispersión, evidenciando la relación fuerte y

positiva que tienen ambas variables de investigación, que se verá en la siguiente figura:

Figura 1: Cuadro de dispersión entre las variables X, Y

Fuente: Elaboración del investigador (25/06/2022) con datos de la INEI (2022). Realizado con

calculadora Casio fx- CG50

Con la hipótesis planteada anteriormente, se presenta una problemática: ¿De qué manera

se puede continuar la predicción de las dos variables de investigación? Lo primero que

se debe tomar en cuenta es que haya una relación fuerte, que se realizará a través de la

correlación de Pearson.

Fórmula 1: Correlación de Pearson

Verificamos la correlación de Pearson, para calcular el valor de r:

𝑆𝑥𝑦 (𝑆𝑥)
𝑟=
(𝑆𝑦)

Ahora calculamos las soluciones parciales:

∑𝑥.∑𝑦
𝑆𝑥𝑦 = ∑ 𝑥𝑦 −
𝑛

= (3.68272848378409 × 1020)

(1.422928003 × 109)(1.5014856 × 1013)



72 = 7.153591694 × 1019
𝑆𝑥 = √∑ 𝑥2 − (∑ 𝑥)2 (1.422928003 × 109)2
√ (
= 3.25678057496944 × 10 −
16
)
𝑛 72

= 66683113.83

𝑆𝑦 = √∑ 𝑦2 − (∑ 𝑦)2 (1.5014856 × 1013)2



= (4.563869221148 × 10 ) −
24
𝑛 72

= 1.196944508 × 1012

Ahora reemplazando:

7.153591694 × 1019
𝑟= = 0,896260508 = 0,897
(66683113.83)(1.196944508 × 1012)

Para comprobar el resultado, se mostrará la correlación de Pearson, como también los

datos de la fórmula según la calculadora Casio-fx-CG50 en las siguientes figuras:

Figura 2: Datos de la regresión lineal Figura 3: Datos de la fórmula de la regresión

Figura 4: Datos de la fórmula de la regresión

Fuente: Elaboración del investigador (27/06/2022) con datos de la INEI (2022). Realizado con

calculadora Casio fx- CG50


El resultado es positivo, acercándose significativamente a 1, mostrando una correlación

fuerte y positiva de las variables, lo cual permite validar la investigación. Realizada la

correlación, el siguiente paso es la recta de regresión, dada por la ecuación 𝑦 = 𝑎𝑥 + 𝑏.

Utilizando las siguientes fórmulas:

Fórmula 2: Recta de regresión

𝑛 ∑ 𝑥𝑦 − ∑ 𝑥. ∑ 𝑦
𝑎=
𝑛 ∑ 𝑥2 − (∑ 𝑥)2

72(3.68272848378409 × 1020) − (1.422928003 × 109)(1.5014856 × 1013)


=
72(3.25678057496944 × 1016) − (1.422928003 × 109)2

= 16087.64245

∑𝑦−𝑎∑ (1.5014856 × 1013) − (16087.64245(1.422928003 × 109))


𝑏= =
𝑥 72
𝑛

= −1.0939866242 × 1011

𝑦 = 𝑎𝑥 + 𝑏 = 16087.64245𝑥 − 1.0939866242 × 1011

Mostramos ahora los gráficos de regresión con la aplicación del Mintitab 19, Excel

y la calculadora Casio fx-CG50, para evidenciar la igualdad de la función:

Figura 5: Recta de regresión

Fuente: Elaboración del investigador (30/06/2022) con datos de la INEI (2022). Realizado

con Minitab 19

Figura 6: Recta de Regresión 2


Fuente: Elaboración del investigador (30/06/2022) con datos de la INEI (2022). Registro de

Descarga Calculadora Científica Casio FX CG50

Figura 7: Recta de Regresión 3

GRÁFICA N° 06: FUNCIÓN DE REGRESIÓN LINEAL CRECIMIENTO POBLACIONAL -


S/ 600,000,000,
PRODUCTO BRUTO INTERNO EN EL PERÚ SERIE 1950 -2021
000.0
PRODUCTO BRUTO INTERNO

0
NACIONAL - 1950 AL 2021

S/ 500,000,000,000.00
S/ 400,000,000,000.00 y = 16088x - 1E+11
S/ 300,000,000,000.00
S/ 200,000,000,000.00
S/ 100,000,000,000.00
S/ - 0 5000000 10000000 15000000 20000000 25000000 30000000 35000000
CRECIMIENTO POBLACIONAL EN EL PERÚ - 1950 AL 2021
Fuente: Elaboración del investigador (30/06/2022) con datos de la INEI (2022). Realizado con
Excel
El tratamiento de los datos mediante el uso del software MINITAB 19, nos

registró la siguiente función de regresión lineal:

La ecuación de regresión es:

𝑃𝑅𝑂𝐷𝑈𝐶𝑇𝑂 𝐵𝑅𝑈𝑇𝑂 𝐼𝑁𝑇𝐸𝑅𝑁𝑂

= − 1.1𝐸 + 11 + 1,6𝐸 + 4 𝐶𝑅𝐸𝐶𝐼𝑀𝐼𝐸𝑁𝑇𝑂 𝑃𝑂𝐵𝐿𝐴𝐶𝐼𝑂𝑁𝐴𝐿

En la recta de regresión, “a” viene a ser la pendiente y “b” es la intersección en el eje

Y.

𝑦 = (1.6𝑥104)𝑥 + (−1.1𝑥1011)

Se puede precisar que la pendiente de la recta es un valor positivo:


𝑎 = 1.6𝑥104

Analizando los valores de “a” podemos inferir que la variable x: Crecimiento

Poblacional, se relaciona de forma proporcional creciente con la variable y: Producto

Bruto Interno, con un nivel de confianza del 89,62605% (𝑟 = 0,8962605) de acuerdo

con el coeficiente de correlación lineal.

En el registro y tratamiento de los datos estimamos que la información no es altamente

precisa, puesto que no es una regresión lineal con correlación perfecta, pero si con una

correlación fuerte, por lo cual podemos calcular los errores de medición, aplicando del

uso del método de mínimos cuadrados en la investigación, ya que posee un rango de

error en a y en b, permitiendo poder sacar una ecuación más ajustada a lo que se

necesita. Tomaremos en cuenta el factor: 𝛽2 = ∑(b − ax + y)2 calculado en la tabla de

Excel para precisar el rango de error en la pendiente (a) y el intercepto vertical (b):

Fórmula 3: Rango de error de m

Rango de Error de la pendiente (a):

𝑛 𝛽2
𝑒(𝑎) = √ ×
𝑛 ∑ 𝑥2 − (∑ 𝑥)2 𝑛−2

72
× 4.89770269364573 × 10
23
=√
72(3.25678057496944 × 10 ) − (1.422928003 × 10 )
16 9 2
72 − 2

= 1254.386345 = 0.1254386345 × 104

Fórmula 4: Rango de error de b

Rango de Error del intercepto (b):


∑ 𝑥2 2
𝑒(𝑏) = √ × 𝛽
𝑛 ∑ 𝑥2 − (∑ 𝑥)2 𝑛 − 2

3.25678057496944 × 1016
× 4.89770269364573 × 10
23
=√
72(3.25678057496944 × 10 ) − (1.422928003 × 10 )
16 9 2
72 − 2

= 0.266783717 × 1011

Por lo que la función de regresión lineal queda expresada por:

y = (16087.64245 ± 0.1254386345 × 104)x + (−1.0939866242 × 1011

± 0.266783717 × 1011)

Para finalizar la investigación, se procederá a realizar derivadas parciales, para poder

comprobar que todo lo que se ha realizado es conforme con la investigación. Con ello,

se sabrá si la hipótesis planteada es correcta.

Fórmula 5: Aplicación de las derivadas parciales

∑ 𝑟(𝑎, 𝑏) = ∑(𝑎𝑥1 + 𝑏 − 𝑦1)2


𝑡=1

Ahora procedemos a aplicar las derivadas parciales respecto a la ecuación:

𝑦 = 𝑎𝑥 + 𝑏 para asegurar la realización correcta de la recta de regresión.

∑ 𝑟(𝑎, 𝑏) = ∑(𝑎𝑥𝑖 + 𝑏 − 𝑦𝑖)2


𝑖=1

Se aplicó la derivación a partir de las constante a y b.

Derivando respecto “a”:

𝑛
𝜕𝑆𝑟
= ∑ 2(𝑎𝑥𝑖 + 𝑏 − 𝑦𝑖)𝑥𝑖 = 0
𝜕𝑎 𝑖=1

Distribuyendo la sumatoria de la ecuación podemos simplificar en:


𝑛

∑(𝑎𝑥𝑖2 + 𝑏𝑥𝑖 − 𝑥𝑖𝑦𝑖) = 0


𝑖=1

𝑛 𝑛 𝑛

𝑎 ∑ 𝑥 + 𝑏 ∑ 𝑥𝑖 = ∑ 𝑥𝑖. 𝑦𝑖
𝑖
2

𝑖=1 𝑖=1 𝑖=1

Derivando respecto a “b”:

𝑛
𝜕𝑆𝑟
= ∑ 2(𝑎𝑥𝑖 + 𝑏 − 𝑦𝑖) = 0
𝜕𝑏 𝑖=1

Distribuyendo la sumatoria de la ecuación podemos simplificar en:


𝑛

∑(𝑎𝑥𝑖 + 𝑏 − 𝑦𝑖) = 0
𝑖=1

𝑛 𝑛

𝑎 ∑ 𝑥𝑖 + 𝑏𝑛 = ∑ 𝑦𝑖
𝑖=1 𝑖=1

Ahora resolveremos el sistema de ecuaciones de las variables a y b, mediante una

matriz de ecuaciones:
𝑛 𝑛 𝑛
𝖥∑ 𝑥 2 𝖥 1
𝑖 ∑ ∑ 𝑥𝑖 . 𝑦
1 I
𝑥𝑖
I I 𝑖I
I𝑖=1 𝑖=1 I 𝑎. I 𝑖=1 I
[ ]=
𝑛
II ∑ 𝑥 I 𝑏 I
𝑛
I
𝑖 𝑛 I I ∑ 𝑦𝑖 I
[ 𝑖=1 ] [ 𝑖=1 ]

Resolvemos la matriz de ecuaciones:

[∑ 𝑥𝑖. 𝑦𝑖 ∑ 𝑥𝑖]
∑𝑦 𝑛 𝑛 ∑ 𝑥𝑖. 𝑦𝑖 − ∑ 𝑥𝑖 ∑ 𝑦𝑖
𝑖
𝑎= =
𝑛 ∑ 𝑥𝑖2 − (∑ 𝑥𝑖)2 𝑛 ∑ 𝑥𝑖2 − (∑ 𝑥𝑖)2
∑ 𝑦𝑖 − 𝑎 ∑
𝑥𝑖 = 𝑦̅ − 𝑎𝑥̅
𝑏=
𝑛

Ahora reemplazando los valores de a y b.

72 (3.68272848378409 × 1020) − (1.422928003 × 109)(1.5014856 × 1013)


𝑎=
2
72 (3.25678057496944 × 1016) − (1.422928003 × 109 )

= 16087.64245
1.5014856 × 1013 1.422928003 × 109
𝑏=(
72 ) − (16087.64245) ( )
72
= −1.0939866242 × 1011

Lo que permite demostrar la función de regresión lineal:

𝑦 = 𝑎𝑥 + 𝑏 = 16087.64245𝑥 − 1.0939866242 × 1011

Comprobación:

Para comprobar lo investigado, se elegirá un dato de la muestra, seleccionando el año

2020, donde la población fue de 32625948. Luego al reemplazar en la función de

regresión lineal obtenemos un valor aproximado, debido a los errores en los parámetros:

y = (16087.64245 + 0.1254386345 × 104)(32625948)

+ (−1.0939866242 × 1011 + 0.266783717 × 1011)

= 483 079 839 000

El valor máximo obtenido función de regresión se encuentra por debajo del dato

real debido a la dispersión de la muestra.


𝑦𝑖−𝑦𝑚𝑎𝑥
Error de estimación: 𝑒 | . 100% =
𝐸𝑠𝑡𝑖𝑚𝑎𝑐𝑖ó𝑛 = |
𝑦𝑖

486 737 000 000.00−483 079 839


000
( ) . 100% = 7, 51362851𝑥10−3 . 100% = 0,00751 =
486 737 000 000.00

0,75%

En el registro de la información el valor de comprobación se dispersa un 0,75%

mostrando que la fuente de información muestra un error de estimación aceptable en los

datos procesados.

El nivel de confiabilidad de una dispersión de muestra aleatoria compleja:


𝜂𝐷𝑖𝑠𝑝 = |𝑦̅ − 𝛽
| 𝑥100%
𝑦̅
15014856000000.00 − √4.89770269364573 × 1023
=| | 𝑥100%
15014856000000.00
= 95,3391%
Conclusiones

De acuerdo con los procesos realizados en la investigación exploratoria y durante la

aplicación de los criterios matemáticos referente al método de los mínimos cuadrados y

la función de regresión lineal, teniendo en cuenta la pregunta de indagación formulada

como parte del problema que dice: “¿De qué manera el crecimiento poblacional en el

Perú influye en el producto bruto interno en la economía nacional, entre los años 1950

al 2021?”.

En base a los resultados analizados en el marco operativo matemático, se puede concluir

que: “El Crecimiento Poblacional en el Perú influye de forma proporcional creciente al

Producto Bruto Interno en la economía nacional, entre los años 1950 al 2021”. Por ende,

podemos precisar que la estimación obtenida de la influencia del crecimiento

poblacional generó un aumento en el producto bruto interno en la Economía Nacional

entre los años 1950 al 2021.

Esta conclusión se fortalece con los valores de los parámetros:

𝑚 = 16087.64245 que representa la pendiente de la función de regresión lineal, al ser

positiva nos indica que la proporción es creciente.

b= −1.0939866242 × 1011 que nos indica el valor del intercepto vertical de la función

de regresión lineal.

Finalmente, podemos concluir que la función de regresión lineal fue:

𝑦 = 𝑚𝑥 + 𝑏 = 16087.64245𝑥 − 1.0939866242 × 1011


Limitaciones

En la investigación se ha tenido limitaciones tecnológicas en lo que se refiere las fuentes

de información, en el uso del software adecuado para estimar los indicadores del

método de los mínimos cuadrados, además en el manejo de las derivadas parciales para

detallar las condiciones de certeza de la función de regresión lineal.

Sugerencias

En la investigación desarrollada es necesario identificar el método de los mínimos

cuadrados utilizando los diversos recursos tecnológicos para fortalecer la comprobación

de los parámetros y errores en el proceso de análisis de los datos, cuantificando el

coeficiente de correlación para aceptar la validez de la regresión lineal.


Bibliografía

Buchanan, L., Fensom, J., Kemp, E., La Rondie, P., & Stevens, J. (2015).

Matemáticas Nivel Medio. Oxford: Oxford

Camacho-Sandoval, J. (2008). Asociación entre variables cuantitativas: análisis

de correlación. SCIELO. [Link]

60022008000200005&script=sci_arttext

Galdós, L. (2005). Cálculo y Estadística II (Cultural, S.A. ed.). El Comercio.

Gómez, V., & López, E. (2017). Teoría y problemas resueltos de matemática

aplicada y estadística para farmacia. Madrid: Paraninfo.

Hurtado, E. (s.f.). Cálculo Diferencial e Integral III. El método de los mínimos

cuadrados. Facultad de Ciencias UNAM.

INE - Instituto Nacional de Estadística. (s. f.). Glosario de Conceptos.

[Link]

7E:text=Definici%C3%B3n,vegetativo%20y%20el%20saldo%20migratori o.

INEI- Instituto Nacional de Estadística e Informática. (2022). Panorama de la

Economía Peruana 1950–2021.

Ministerio de Economía y Finanzas del Perú. (s. f.). Conoce los conceptos Básicos

para comprender la economía. Perú: Ministerio de Economía y Finanzas.

[Link] basicos-para-

comprender-la-economia-del- pais&option=com_content&language=en-

GB&view=article&lang=en-GB

También podría gustarte