Skip to content

gorop51-2/HR-analysis

Repository files navigation

HR-analysis

Python Jupyter License: MIT

📊 Описание проекта

Анализ рекрутинговой воронки и времени прохождения этапов найма в зависимости от способа добавления кандидатов («Откликнулся» / «Добавлен»). Проект включает визуализацию конверсий по этапам найма и сегментацию вакансий по ключевым метрикам. Реализовано на Python с использованием современных библиотек для анализа данных и визуализации.

✨ Особенности

  • Анализ конверсии: Визуализация прохождения кандидатов по этапам (Скриннинг → Интервью с менеджером → Интервью с заказчиком → Оффер)
  • Сравнение источников: Анализ эффективности разных способов добавления кандидатов
  • Временной анализ: Изучение времени прохождения каждого этапа
  • Кластеризация: Сегментация вакансий с использованием алгоритмов кластеризации (HDBSCAN)
  • Интерактивные графики: Визуализации с использованием Plotly для интерактивного анализа
  • Статистический анализ: Проверка гипотез с использованием непараметрических тестов

🛠 Установка

Предварительные требования

  • Python 3.8 или выше
  • Jupyter Notebook или JupyterLab

Установка зависимостей

  1. Клонируйте репозиторий:
git clone https://github.com/your-username/HR-analysis.git
cd HR-analysis
  1. Создайте виртуальное окружение (рекомендуется):
python -m venv venv
source venv/bin/activate  # для Linux/Mac
# или
venv\Scripts\activate     # для Windows
  1. Установите зависимости:
pip install -r requirements.txt

🚀 Использование

  1. Запустите Jupyter Notebook:
jupyter notebook
  1. Откройте файл test-task.ipynb

  2. Выполните ячейки последовательно для проведения анализа

Структура анализа

Ноутбук содержит следующие разделы:

  • Загрузка и предобработка данных
  • Исследовательский анализ данных (EDA)
  • Анализ конверсии по этапам найма
  • Сравнение источников кандидатов
  • Кластеризация вакансий
  • Выводы и рекомендации

📁 Структура проекта

HR-analysis/
├── test-task.ipynb                    # Основной ноутбук с анализом HR данных
├── requirements.txt                   # Список зависимостей Python
├── README.md                         # Документация проекта
├── LICENSE                           # Лицензия проекта
├── .gitignore                        # Файлы, игнорируемые Git
├── .gitattributes                    # Атрибуты Git для файлов
└── Выгрузка статистики_2023.04.03_13_23.xlsx  # Данные для анализа (Excel файл)

📊 Данные

Проект включает реальный датасет в формате Excel (Выгрузка статистики_2023.04.03_13_23.xlsx) с информацией о:

  • Кандидатах и их прохождении по этапам найма
  • Способе добавления кандидата (отклик/добавлен)
  • Временных метках прохождения каждого этапа
  • Информации о вакансиях

Примечание: Данные анонимизированы и могут быть использованы для демонстрации анализа.

🐍 Зависимости

Основные библиотеки, используемые в проекте:

  • pandas - обработка и анализ данных
  • numpy - численные вычисления
  • matplotlib - статическая визуализация
  • seaborn - статистическая визуализация
  • plotly - интерактивные графики
  • scipy - научные вычисления
  • missingno - визуализация пропущенных значений
  • hdbscan - кластеризация данных
  • ipywidgets - интерактивные виджеты для Jupyter

Полный список зависимостей см. в файле requirements.txt.

🤝 Вклад в проект

  1. Fork проекта
  2. Создайте ветку для вашей фичи (git checkout -b feature/AmazingFeature)
  3. Commit изменений (git commit -m 'Add some AmazingFeature')
  4. Push в ветку (git push origin feature/AmazingFeature)
  5. Создайте Pull Request

📄 Лицензия

Этот проект распространяется под лицензией MIT. См. файл LICENSE для подробностей.

📞 Контакты

Если у вас есть вопросы или предложения, создайте issue в этом репозитории.


Проект создан в качестве тестового задания на вакансию аналитика данных в CSC-HR.

About

Анализ рекрутинговой воронки и времени прохождения этапов найма в зависимости от способа добавления кандидатов («Откликнулся» / «Добавлен»).

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors