Skip to content

danielrawlins21/ACF_Clustering

Repository files navigation

🐧 Clustering de especies de pingüinos mediante PCA y técnicas de agrupamiento

📌 Descripción del proyecto

Este proyecto tiene como objetivo analizar la estructura subyacente de un conjunto de datos de pingüinos mediante técnicas de:

  • Análisis exploratorio de datos (EDA)
  • Análisis de Componentes Principales (PCA)
  • Clustering jerárquico
  • Clustering mediante K-means
  • Validación de modelos (coeficiente de silueta)
  • Comparación de métodos

El objetivo principal es identificar agrupamientos naturales en los datos y evaluar qué método reproduce mejor la estructura real (especies).


📊 Dataset

El dataset utilizado corresponde a mediciones físicas de pingüinos, incluyendo:

  • bill_length_mm
  • bill_depth_mm
  • flipper_length_mm
  • body_mass_g
  • species
  • island
  • sex

⚙️ Tecnologías utilizadas

  • Python 3.x
  • pandas
  • numpy
  • matplotlib
  • seaborn
  • scikit-learn
  • scipy

📁 Estructura del proyecto

El proyecto está organizado en 7 notebooks de Jupyter, siguiendo el flujo lógico del análisis:

About

Implementación de Clustering y PCA para dataset pinguins

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors