0% encontró este documento útil (0 votos)
80 vistas19 páginas

Analisis Descriptivo Iris Data

Este documento realiza un análisis descriptivo de la base de datos Iris. Se lee el conjunto de datos e inspecciona las características. Luego, se generan histogramas para visualizar la distribución de las variables y analizar patrones. Finalmente, se describe la variable categórica y se analizan las relaciones entre las variables mediante un gráfico de pares y una matriz de correlación.

Cargado por

Santi Tapia
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
80 vistas19 páginas

Analisis Descriptivo Iris Data

Este documento realiza un análisis descriptivo de la base de datos Iris. Se lee el conjunto de datos e inspecciona las características. Luego, se generan histogramas para visualizar la distribución de las variables y analizar patrones. Finalmente, se describe la variable categórica y se analizan las relaciones entre las variables mediante un gráfico de pares y una matriz de correlación.

Cargado por

Santi Tapia
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

analisis-descriptivo-iris-data

March 14, 2024

0.0.1 Reading-in the Iris data

[ ]: !pip install ucimlrepo


# Importar las bibliotecas necesarias
import pandas as pd
from ucimlrepo import fetch_ucirepo

# Fetch del conjunto de datos


iris_data = fetch_ucirepo(id=53)

# Crear un DataFrame para las características y los objetivos


df = pd.concat([iris_data.data.features, iris_data.data.targets], axis=1)

df.head()
df.tail()

From URL: https://archive.ics.uci.edu/ml/machine-learning-


databases/iris/iris.data
Requirement already satisfied: ucimlrepo in /usr/local/lib/python3.10/dist-
packages (0.0.3)

[ ]: sepal length sepal width petal length petal width class


145 6.7 3.0 5.2 2.3 Iris-virginica
146 6.3 2.5 5.0 1.9 Iris-virginica
147 6.5 3.0 5.2 2.0 Iris-virginica
148 6.2 3.4 5.4 2.3 Iris-virginica
149 5.9 3.0 5.1 1.8 Iris-virginica

[ ]: df.head()

[ ]: sepal length sepal width petal length petal width class


0 5.1 3.5 1.4 0.2 Iris-setosa
1 4.9 3.0 1.4 0.2 Iris-setosa
2 4.7 3.2 1.3 0.2 Iris-setosa
3 4.6 3.1 1.5 0.2 Iris-setosa
4 5.0 3.6 1.4 0.2 Iris-setosa

Es importante conocer las características de la base de datos que se desea trabajar. Para esto,
se aplica la función mydata.info(), la cual proporciona información completa del DataFrame,

1
incluyendo el tipo de datos de cada columna, el número de valores no nulos y la cantidad de
memoria utilizada.
#Conociendo y caracterizando los datos de la base de datos IRIS
#ANALISIS DESCRIPTIVO DE LA BASE DE DATOS (IRIS)

[ ]: #Da toda la información del data frame


df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 150 entries, 0 to 149
Data columns (total 5 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 sepal length 150 non-null float64
1 sepal width 150 non-null float64
2 petal length 150 non-null float64
3 petal width 150 non-null float64
4 class 150 non-null object
dtypes: float64(4), object(1)
memory usage: 6.0+ KB
La salida anterior refleja que la base de datos tiene un total de 180 filas y 5 columnas. La mayor
parte de los datos son enteros y, además, todos los datos son non-null, lo cual significa que no
hay ningún dato nulo o faltante en el DataFrame. Esto es de suma importancia para los análisis
posteriores.
ESTADÍSTICAS DESCRIPTIVAS:
Luego de identificar que la base de datos es apta y no tiene datos faltantes, se procede a realizar
el análisis descriptivo para lograr caracterizar a los clientes que utilizan cada una de las trotadoras
de CardioGood Fitness.
En primer lugar, se ejecutan histogramas con el fin de identificar patrones de distribución, valores
atípicos o sesgos en los datos. Esto puede ser útil para entender mejor las características de los
clientes, como su edad, nivel de educación, ingresos, nivel fitness, entre otros.
[ ]: #Importación de librerias útiles para la creación de gráficos
import matplotlib.pyplot as plt
#Realizar histogramas de todas las variables
df.hist(figsize=(10,15),color="#2D1456")

[ ]: array([[<Axes: title={'center': 'sepal length'}>,


<Axes: title={'center': 'sepal width'}>],
[<Axes: title={'center': 'petal length'}>,
<Axes: title={'center': 'petal width'}>]], dtype=object)

2
3
Analisis: 1. Sepal Length:
La distribución de la longitud del sépalo sugiere que la mayoría de las plantas Iris presentan lon-
gitudes concentradas en el rango (5.2, 5.9) cm, con una frecuencia notable. Aunque hay cierta
variabilidad, la moda, mediana y media indican que esta característica tiende a centrarse alrede-
dor de 6.0. Se observa un sesgo hacia la derecha aproximadamente, sugiriendo que hay algunas
observaciones con longitudes de sépalos con mas frecuencia en esa direccion.
2. Sepal Width:
La distribución del ancho del sépalo muestra una concentración significativa en el rango (2.9, 3.3)
cm, y una mediana cercana a 3.0. La media también refleja esta concentración. Aunque existe
variabilidad, se nota un sesgo hacia la izquierda, indicando que hay valores más bajos que afectan
la distribución de anchos de sépalos.
3. Petal Length:
La longitud del pétalo tiende a concentrarse en el intervalo (1.0, 1.66)cm, siendo este último el más
frecuente. La mediana y la media indican una posición central alrededor de 4.4 y 3.76 respectiva-
mente. La distribución muestra un sesgo hacia la derecha, sugiriendo que hay algunas longitudes
de pétalos superiores que afectan la forma general.
4. Petal Width:
El ancho del pétalo exhibe una fuerte concentración en el rango (0.1, 0.3) cm. Hay un sesgo hacia
la derecha, indicando que hay valores más bajos que afectan la distribución de anchos de pétalos.
Los histogramas de las plantas Iris revelan concentraciones específicas en las longitudes y anchos
de los sépalos, indicando cierta uniformidad, mientras que las longitudes y anchos de los pétalos
muestran mayor variabilidad. La diversidad en estas características sugiere la complejidad en la
clasificación de las especies de Iris.
Se describe la variable categorica de las plantas iris
[ ]: df.describe(include=object)

[ ]: class
count 150
unique 3
top Iris-setosa
freq 50

La variable categórica “class” en el conjunto de datos presenta un total de 150 observaciones,


distribuidas en tres categorías únicas que representan las especies de plantas Iris. La clase más
frecuente es “Iris-setosa” con una frecuencia de 50, lo que sugiere un conjunto de datos equilibrado,
donde cada especie está representada por igual. Este atributo se utiliza para etiquetar y clasificar
las plantas según su especie, siendo un componente clave en la tarea de clasificación multiclase.
Es útil tener una visión general de las relaciones existentes entre las variables. En primer lugar,
el gráfico de pares pairplot ayudará a visualizar las relaciones bivariadas entre las variables en

4
el DataFrame. Esto puede ayudar a identificar tendencias y relaciones entre las variables, lo que
puede ser útil para entender cómo se relacionan las variables entre sí.
Al examinar la matriz de correlación, se pueden identificar las variables que están correlacionadas
entre sí, lo que puede ser útil para entender cómo las variables pueden influir en las características
de las plantas.
[ ]: import seaborn as sns
# Crear un gráfico de pares para visualizar las relaciones bivariadas entre las␣
↪variables en el DataFrame

sns.pairplot(df)
plt.figure(figsize=(15, 7))

# Crear un mapa de calor de la matriz de correlación del DataFrame 'mydata' y␣


↪mostrar los valores de correlación en el mapa

sns.heatmap(df.corr(), annot=True)
plt.show()

# Imprimir la matriz de correlación del DataFrame 'mydata'


df.corr()

<ipython-input-44-d5d3aff3d0ca>:7: FutureWarning: The default value of


numeric_only in DataFrame.corr is deprecated. In a future version, it will
default to False. Select only valid columns or specify the value of numeric_only
to silence this warning.
sns.heatmap(df.corr(), annot=True)

5
6
<ipython-input-44-d5d3aff3d0ca>:11: FutureWarning: The default value of
numeric_only in DataFrame.corr is deprecated. In a future version, it will
default to False. Select only valid columns or specify the value of numeric_only
to silence this warning.
df.corr()

[ ]: sepal length sepal width petal length petal width


sepal length 1.000000 -0.109369 0.871754 0.817954
sepal width -0.109369 1.000000 -0.420516 -0.356544
petal length 0.871754 -0.420516 1.000000 0.962757
petal width 0.817954 -0.356544 0.962757 1.000000

Análisis: Del primer gráfico se pueden identificar unas relaciones lineales entre las variables, donde
las más relevantes para el estudio son las que presentan una correlacion fuerte o moderada, en este
caso a nivel grafico vemos que pares de variables como (Sepal lenght- petal with), (Petal lenght-
petal width), (sepal lenght - petal lenght) son las que pueden presentar una relacion positiva.
También es visible que la normalidad puede ser incierta en casi todas las variables excepto sepal
with y sepal lenght que parecen acomodarse normalmente.
Luego para contrastar numéricamente la correlación, se realiza un gráfico de calor de correlación que
contiene el coeficiente para realizar un análisis más exacto de los datos, tenemos que los maximos
en esta medida son:
• La correlación mas alta son las de las variables (Petal lenght- petal width), estan son variables
directamente relacionadas por lo que es muy coherente.
Esto implica que las las variables con correlacion alta pueden tener una relacion para la explicacion,
y por otro lado que variables como las minimas no tienen ninguna relacion.
¿COMO ES LA DISTRIBUCION DE PARES PERO DIFERENCIANDOLO POR CLASES?

7
[ ]: #Distribución de Pares de Variables Morfológicas por Especie
plt.figure(figsize=(12, 8))
sns.pairplot(df, hue='class', markers=["o", "s", "D"])
plt.suptitle('Distribución de Pares de Variables Morfológicas por Especie', y=1.
↪02)

plt.show()

<Figure size 1200x800 with 0 Axes>

Analisis: Se puede observar las mismas relaciones pero podemos observar diferencians dentro de
cada variable con la clase, se puede hacer la suposicion de que la longitud y el ancho del sepalo y
el petalo es mas pequeña para la iris setosa, mediana para la iris-versicolor y mayor para la iris
virginica, siguiendo la comparacion por colores, ademas por clase se mantienen las conclusiones
dadas anteriormente, como las relaciones y normalidad, en este caso para cada clase
A continuación, se realizan diagramas de caja para cada variable morfológica por clase en el conjunto
de datos de plantas Iris. Para proporcionar una representación visual eficiente de la distribución

8
de datos y una rápida identificación de patrones y variaciones entre las especies.
[ ]: import seaborn as sns
import matplotlib.pyplot as plt

# Configurar el estilo de seaborn para mejorar la estética de los gráficos


sns.set(style="whitegrid")

# Lista de variables morfológicas


variables = ['sepal length', 'sepal width', 'petal length', 'petal width']

# Crear boxplots para cada variable morfológica por clase


for variable in variables:
plt.figure(figsize=(8, 6))
sns.boxplot(x='class', y=variable, data=df)
plt.title(f'Boxplot de {variable} por Clase')
plt.show()

9
10
11
Longitud del Sépalo:
• Iris-setosa: La longitud del sépalo tiende a ser más corta, con una mediana alrededor de 5.0
y una dispersión moderada.
• Iris-versicolor: Se observa una mediana cercana a 5.9, indicando sépalos más largos en com-
paración con Iris-setosa, con una mayor dispersión.
• Iris-virginica: Los sépalos son más largos en promedio, con una mediana alrededor de 6.5 y
una dispersión relativamente amplia.
Ancho del Sépalo: * Iris-setosa: Presenta un ancho del sépalo moderado, con una mediana alrededor
de 3.4 y una dispersión moderada. * Iris-versicolor: La mediana está cerca de 2.8, indicando sépalos
más angostos en comparación con Iris-setosa, con una dispersión moderada. * Iris-virginica: Los
sépalos son más anchos en promedio, con una mediana alrededor de 3.0 y una dispersión moderada.
Longitud del Pétalo: * Iris-setosa: Los pétalos son más cortos, con una mediana alrededor de 1.5
y una dispersión estrecha. * Iris-versicolor: La mediana está alrededor de 4.35, indicando pétalos
más largos en comparación con Iris-setosa, con una dispersión moderada. * Iris-virginica: Presenta
los pétalos más largos, con una mediana cerca de 5.55 y una dispersión relativamente amplia.
Ancho del Pétalo: * Iris-setosa: Tiene los pétalos más estrechos, con una mediana alrededor de 0.2
y una dispersión estrecha. * Iris-versicolor: La mediana está cerca de 1.3, indicando pétalos más

12
anchos en comparación con Iris-setosa, con una dispersión moderada. * Iris-virginica: Presenta los
pétalos más anchos en promedio, con una mediana alrededor de 2.0 y una dispersión moderada.
Conclusion:
Iris-setosa tiende a tener las medidas más pequeñas, especialmente en longitud y ancho de pétalos.
Por otro lado, La Iris-virginica tiende a tener medidas más grandes en general, con sépalos y pétalos
más largos y anchos. Finalmente La Iris-versicolor muestra características intermedias en términos
de longitud y ancho de sépalos y pétalos.
Para confirnar numéricamente las conclusiones obtenidas a partir de los gráficos anteriores, se
realiza la descripción de todas las variables:
[ ]: # Configurar pandas para mostrar todas las columnas
pd.set_option('display.max_columns', None)

# Estadísticas por Producto


stats = df.groupby("class").describe(include="all")

# Imprimir las estadísticas por producto


print("\nEstadísticas por clase:")
print(stats)

Estadísticas por clase:


sepal length \
count mean std min 25% 50% 75% max
class
Iris-setosa 50.0 5.006 0.352490 4.3 4.800 5.0 5.2 5.8
Iris-versicolor 50.0 5.936 0.516171 4.9 5.600 5.9 6.3 7.0
Iris-virginica 50.0 6.588 0.635880 4.9 6.225 6.5 6.9 7.9

sepal width \
count mean std min 25% 50% 75% max
class
Iris-setosa 50.0 3.418 0.381024 2.3 3.125 3.4 3.675 4.4
Iris-versicolor 50.0 2.770 0.313798 2.0 2.525 2.8 3.000 3.4
Iris-virginica 50.0 2.974 0.322497 2.2 2.800 3.0 3.175 3.8

petal length \
count mean std min 25% 50% 75% max
class
Iris-setosa 50.0 1.464 0.173511 1.0 1.4 1.50 1.575 1.9
Iris-versicolor 50.0 4.260 0.469911 3.0 4.0 4.35 4.600 5.1
Iris-virginica 50.0 5.552 0.551895 4.5 5.1 5.55 5.875 6.9

petal width
count mean std min 25% 50% 75% max
class

13
Iris-setosa 50.0 0.244 0.107210 0.1 0.2 0.2 0.3 0.6
Iris-versicolor 50.0 1.326 0.197753 1.0 1.2 1.3 1.5 1.8
Iris-virginica 50.0 2.026 0.274650 1.4 1.8 2.0 2.3 2.5
Analisis:
1. Sepal lenght*:
Iris-setosa: La longitud del sépalo varía desde 4.3 hasta 5.8, con una concentración mayor alrededor
de 5.0. La dispersión es baja, indicada por una desviación estándar de 0.352.
Iris-versicolor: Presenta longitudes del sépalo en el rango de 4.9 a 7.0, con una mediana de 5.9. La
variabilidad es moderada, reflejada por una desviación estándar de 0.516.
Iris-virginica: Las longitudes del sépalo se encuentran entre 4.9 y 7.9, destacándose por una mediana
de 6.5. La distribución muestra mayor dispersión, con una desviación estándar de 0.636.
2. Sepal width:
Iris-setosa: El ancho del sépalo varía de 2.3 a 4.4, con una concentración alrededor de 3.4. La
dispersión es relativamente baja, indicada por una desviación estándar de 0.381.
Iris-versicolor: Muestra anchos de sépalo entre 2.0 y 3.4, con una mediana de 2.8. La variabilidad
es moderada, reflejada por una desviación estándar de 0.314.
Iris-virginica: Presenta anchos de sépalo que van desde 2.2 hasta 3.8, destacándose una mediana
de 3.0. La distribución muestra cierta dispersión, con una desviación estándar de 0.322.
3. Petal lenght:
Iris-setosa: La longitud del pétalo varía de 1.0 a 1.9, con una concentración alrededor de 1.5. La
dispersión es baja, indicada por una desviación estándar de 0.174.
Iris-versicolor: Presenta longitudes de pétalo entre 3.0 y 5.1, con una mediana de 4.35. La variabil-
idad es moderada, reflejada por una desviación estándar de 0.470.
Iris-virginica: Las longitudes de pétalo se encuentran entre 4.5 y 6.9, con una mediana de 5.55. La
distribución muestra mayor dispersión, con una desviación estándar de 0.552.
4. Petal width:
Iris-setosa: El ancho del pétalo varía de 0.1 a 0.6, con una concentración alrededor de 0.2. La
dispersión es baja, indicada por una desviación estándar de 0.107.
Iris-versicolor: Muestra anchos de pétalo entre 1.0 y 1.8, con una mediana de 1.3. La variabilidad
es moderada, reflejada por una desviación estándar de 0.198.
Iris-virginica: Presenta anchos de pétalo que van desde 1.4 hasta 2.5, destacándose una mediana
de 2.0. La distribución muestra cierta dispersión, con una desviación estándar de 0.275.
Se confirman las afirmaciones hechas anteriormente de manera visual
Miremos los rangos de las medidas para lograr diferenciar las variabilidades y acercarnos a una
caracterizacion de las plantas mas precisa por medio de una tabla pivot
[ ]: pivot_table_range = df.pivot_table(index='class', aggfunc=lambda x: x.max() - x.
↪min())

14
print(pivot_table_range)

petal length petal width sepal length sepal width


class
Iris-setosa 0.9 0.5 1.5 2.1
Iris-versicolor 2.1 0.8 2.1 1.4
Iris-virginica 2.4 1.1 3.0 1.6
Iris-setosa: La tabla de rango revela que Iris-setosa exhibe una variabilidad relativamente baja en
todas las medidas morfológicas, con rangos de 0.9 en la longitud del pétalo, 0.5 en el ancho del
pétalo, 1.5 en la longitud del sépalo y 2.1 en el ancho del sépalo. Esto sugiere una consistencia
en las dimensiones morfológicas de Iris-setosa, con menos dispersión en comparación con las otras
especies.
Iris-versicolor: Presenta una variabilidad moderada en todas las medidas morfológicas, con rangos
de 2.1 en la longitud del pétalo, 0.8 en el ancho del pétalo, 2.1 en la longitud del sépalo y 1.4 en
el ancho del sépalo. Estos rangos indican una mayor variabilidad en comparación con Iris-setosa,
especialmente en la longitud del pétalo, lo que sugiere una mayor diversidad en las características
morfológicas de esta especie.
Iris-virginica: La tabla muestra que Iris-virginica exhibe la mayor variabilidad en todas las medidas
morfológicas, con rangos de 2.4 en la longitud del pétalo, 1.1 en el ancho del pétalo, 3.0 en la longitud
del sépalo y 1.6 en el ancho del sépalo. Esto indica una amplia diversidad en las dimensiones
morfológicas de Iris-virginica, siendo la especie con la mayor variabilidad en el conjunto de datos.
#El siguiente paso para comprobar nuestras conclusiones se pueden hacer por medio de pruebas de
hipotesis, entonces confirmemos por medio de esta si exsten diferencias significativas en las medias
de cada variable respecto a la clase
Hipótesis Nula (H0): No hay diferencia significativa en las medidas entre las especies de Iris.
Hipótesis Alternativa (H1): Existe al menos una diferencia significativa en las longitudes del pétalo
entre las especies de Iris.
[ ]: from scipy.stats import f_oneway

# Variables morfológicas
morphological_variables = ['sepal length', 'sepal width', 'petal length',␣
↪'petal width']

# Realizar pruebas ANOVA para cada variable morfológica


for variable in morphological_variables:
# Obtener las muestras para cada clase
setosa_data = df[df['class'] == 'Iris-setosa'][variable]
versicolor_data = df[df['class'] == 'Iris-versicolor'][variable]
virginica_data = df[df['class'] == 'Iris-virginica'][variable]

# Realizar la prueba ANOVA


f_statistic, p_value = f_oneway(setosa_data, versicolor_data,␣
↪virginica_data)

15
# Imprimir los resultados
print(f"Resultados ANOVA para {variable}:")
print(f"F estadístico: {f_statistic}")
print(f"Valor p: {p_value}")

# Interpretar el resultado
if p_value < 0.05:
print("Hay evidencia significativa de al menos una diferencia en las␣
↪medias.")

else:
print("No hay suficiente evidencia para rechazar la hipótesis nula de␣
↪igualdad de medias.")

print("=" * 80) # Separador entre las pruebas ANOVA

Resultados ANOVA para sepal length:


F estadístico: 119.26450218450468
Valor p: 1.6696691907693826e-31
Hay evidencia significativa de al menos una diferencia en las medias.
================================================================================
Resultados ANOVA para sepal width:
F estadístico: 47.36446140299382
Valor p: 1.3279165184572242e-16
Hay evidencia significativa de al menos una diferencia en las medias.
================================================================================
Resultados ANOVA para petal length:
F estadístico: 1179.0343277002194
Valor p: 3.0519758018278374e-91
Hay evidencia significativa de al menos una diferencia en las medias.
================================================================================
Resultados ANOVA para petal width:
F estadístico: 959.3244057257613
Valor p: 4.376956957488959e-85
Hay evidencia significativa de al menos una diferencia en las medias.
================================================================================
Analisis: Los resultados de las pruebas ANOVA indican de manera consistente que hay difer-
encias estadísticamente significativas en las variables morfológicas entre las clases de plantas Iris.
Tanto la longitud como el ancho de los sépalos y pétalos exhiben variabilidades que contribuyen
significativamente a la distinción entre las especies
[ ]: from scipy.stats import f_oneway
from statsmodels.stats.multicomp import pairwise_tukeyhsd

# Variables morfológicas
morphological_variables = ['sepal length', 'sepal width', 'petal length',␣
↪'petal width']

16
for variable in morphological_variables:
# Realizar ANOVA
f_statistic, p_value = f_oneway(df[df['class'] == 'Iris-setosa'][variable],
df[df['class'] ==␣
↪'Iris-versicolor'][variable],

df[df['class'] ==␣
↪'Iris-virginica'][variable])

print(f"Resultados ANOVA para {variable}:\n"


f"F estadístico: {f_statistic}\n"
f"Valor p: {p_value}\n"
f"Hay evidencia significativa de al menos una diferencia en las␣
↪medias.\n"


↪"================================================================================")

# Realizar prueba post hoc (Tukey HSD)


tukey_results = pairwise_tukeyhsd(df[variable], df['class'])
print(tukey_results)

Resultados ANOVA para sepal length:


F estadístico: 119.26450218450468
Valor p: 1.6696691907693826e-31
Hay evidencia significativa de al menos una diferencia en las medias.
================================================================================
Multiple Comparison of Means - Tukey HSD, FWER=0.05
===================================================================
group1 group2 meandiff p-adj lower upper reject
-------------------------------------------------------------------
Iris-setosa Iris-versicolor 0.93 0.0 0.6862 1.1738 True
Iris-setosa Iris-virginica 1.582 0.0 1.3382 1.8258 True
Iris-versicolor Iris-virginica 0.652 0.0 0.4082 0.8958 True
-------------------------------------------------------------------
Resultados ANOVA para sepal width:
F estadístico: 47.36446140299382
Valor p: 1.3279165184572242e-16
Hay evidencia significativa de al menos una diferencia en las medias.
================================================================================
Multiple Comparison of Means - Tukey HSD, FWER=0.05
=====================================================================
group1 group2 meandiff p-adj lower upper reject
---------------------------------------------------------------------
Iris-setosa Iris-versicolor -0.648 0.0 -0.8092 -0.4868 True
Iris-setosa Iris-virginica -0.444 0.0 -0.6052 -0.2828 True
Iris-versicolor Iris-virginica 0.204 0.009 0.0428 0.3652 True
---------------------------------------------------------------------

17
Resultados ANOVA para petal length:
F estadístico: 1179.0343277002194
Valor p: 3.0519758018278374e-91
Hay evidencia significativa de al menos una diferencia en las medias.
================================================================================
Multiple Comparison of Means - Tukey HSD, FWER=0.05
===================================================================
group1 group2 meandiff p-adj lower upper reject
-------------------------------------------------------------------
Iris-setosa Iris-versicolor 2.796 0.0 2.5922 2.9998 True
Iris-setosa Iris-virginica 4.088 0.0 3.8842 4.2918 True
Iris-versicolor Iris-virginica 1.292 0.0 1.0882 1.4958 True
-------------------------------------------------------------------
Resultados ANOVA para petal width:
F estadístico: 959.3244057257613
Valor p: 4.376956957488959e-85
Hay evidencia significativa de al menos una diferencia en las medias.
================================================================================
Multiple Comparison of Means - Tukey HSD, FWER=0.05
===================================================================
group1 group2 meandiff p-adj lower upper reject
-------------------------------------------------------------------
Iris-setosa Iris-versicolor 1.082 0.0 0.9849 1.1791 True
Iris-setosa Iris-virginica 1.782 0.0 1.6849 1.8791 True
Iris-versicolor Iris-virginica 0.7 0.0 0.6029 0.7971 True
-------------------------------------------------------------------
Las pruebas ANOVA aplicadas a las variables morfológicas de las especies de Iris revelaron difer-
encias estadísticamente significativas entre las clases. Según las pruebas de Tukey, la longitud del
sépalo de Iris-setosa difiere significativamente de Iris-versicolor e Iris-virginica, siendo menor en
Iris-setosa. En cuanto al ancho del sépalo, Iris-setosa presenta un valor significativamente mayor en
comparación con Iris-versicolor e Iris-virginica. Para la longitud del pétalo, Iris-setosa nuevamente
difiere significativamente de las otras dos especies, siendo menor en longitud. En términos del ancho
del pétalo, Iris-setosa tiene valores significativamente menores en comparación con Iris-versicolor e
Iris-virginica. En resumen, las diferencias en las medidas morfológicas entre las clases sugieren pa-
trones distintivos, donde Iris-setosa tiende a tener dimensiones más pequeñas en todas las variables
en comparación con Iris-versicolor e Iris-virginica.

Variable
Morfológica Iris-setosa Iris-versicolor Iris-virginica
Longitud del Menor longitud, Mediana longitud, Mayor longitud, mayor
Sépalo concentrada moderada dispersión dispersión alrededor de
alrededor de 5.0, alrededor de 5.9, sesgo a 6.5, sesgo a la derecha
sesgo a la derecha la izquierda
Ancho del Moderado ancho, Menor ancho, moderada Mayor ancho, moderada
Sépalo concentrado dispersión alrededor de dispersión alrededor de
alrededor de 3.4, 2.8, sesgo a la derecha 3.0, sesgo a la izquierda
sesgo a la izquierda

18
Variable
Morfológica Iris-setosa Iris-versicolor Iris-virginica
Longitud del Menor longitud, Mediana longitud, Mayor longitud, mayor
Pétalo concentrada moderada dispersión dispersión alrededor de
alrededor de 1.5, alrededor de 4.35, sesgo a 5.55, sesgo a la derecha
sesgo a la derecha la derecha
Ancho del Menor ancho, Menor ancho, moderada Mayor ancho, moderada
Pétalo concentrado dispersión alrededor de dispersión alrededor de
alrededor de 0.2, 1.3, sesgo a la derecha 2.0, sesgo a la derecha
sesgo a la derecha
Diferencias - Sépalos y Pétalos - Sépalos y pétalos - Sépalos y pétalos más
Cualitativas más pequeños medianos intermedios grandes

Conclusion:
Después de analizar detalladamente las características morfológicas de las especies de plantas Iris
(Iris-setosa, Iris-versicolor e Iris-virginica), se observa que Iris-setosa presenta dimensiones más
pequeñas en todas las variables, con longitudes y anchos de sépalo y pétalo menores en comparación
con las otras dos especies. Iris-versicolor muestra medidas intermedias en longitud y ancho de sépalo
y pétalo, mientras que Iris-virginica exhibe las dimensiones más grandes en todas las variables
morfológicas. Estas diferencias destacadas permiten una clara distinción entre las tres especies,
siendo cruciales para su clasificación y reconocimiento.

19

También podría gustarte