Анализ рекрутинговой воронки и времени прохождения этапов найма в зависимости от способа добавления кандидатов («Откликнулся» / «Добавлен»). Проект включает визуализацию конверсий по этапам найма и сегментацию вакансий по ключевым метрикам. Реализовано на Python с использованием современных библиотек для анализа данных и визуализации.
- Анализ конверсии: Визуализация прохождения кандидатов по этапам (Скриннинг → Интервью с менеджером → Интервью с заказчиком → Оффер)
- Сравнение источников: Анализ эффективности разных способов добавления кандидатов
- Временной анализ: Изучение времени прохождения каждого этапа
- Кластеризация: Сегментация вакансий с использованием алгоритмов кластеризации (HDBSCAN)
- Интерактивные графики: Визуализации с использованием Plotly для интерактивного анализа
- Статистический анализ: Проверка гипотез с использованием непараметрических тестов
- Python 3.8 или выше
- Jupyter Notebook или JupyterLab
- Клонируйте репозиторий:
git clone https://github.com/your-username/HR-analysis.git
cd HR-analysis- Создайте виртуальное окружение (рекомендуется):
python -m venv venv
source venv/bin/activate # для Linux/Mac
# или
venv\Scripts\activate # для Windows- Установите зависимости:
pip install -r requirements.txt- Запустите Jupyter Notebook:
jupyter notebook-
Откройте файл
test-task.ipynb -
Выполните ячейки последовательно для проведения анализа
Ноутбук содержит следующие разделы:
- Загрузка и предобработка данных
- Исследовательский анализ данных (EDA)
- Анализ конверсии по этапам найма
- Сравнение источников кандидатов
- Кластеризация вакансий
- Выводы и рекомендации
HR-analysis/
├── test-task.ipynb # Основной ноутбук с анализом HR данных
├── requirements.txt # Список зависимостей Python
├── README.md # Документация проекта
├── LICENSE # Лицензия проекта
├── .gitignore # Файлы, игнорируемые Git
├── .gitattributes # Атрибуты Git для файлов
└── Выгрузка статистики_2023.04.03_13_23.xlsx # Данные для анализа (Excel файл)
Проект включает реальный датасет в формате Excel (Выгрузка статистики_2023.04.03_13_23.xlsx) с информацией о:
- Кандидатах и их прохождении по этапам найма
- Способе добавления кандидата (отклик/добавлен)
- Временных метках прохождения каждого этапа
- Информации о вакансиях
Примечание: Данные анонимизированы и могут быть использованы для демонстрации анализа.
Основные библиотеки, используемые в проекте:
- pandas - обработка и анализ данных
- numpy - численные вычисления
- matplotlib - статическая визуализация
- seaborn - статистическая визуализация
- plotly - интерактивные графики
- scipy - научные вычисления
- missingno - визуализация пропущенных значений
- hdbscan - кластеризация данных
- ipywidgets - интерактивные виджеты для Jupyter
Полный список зависимостей см. в файле requirements.txt.
- Fork проекта
- Создайте ветку для вашей фичи (
git checkout -b feature/AmazingFeature) - Commit изменений (
git commit -m 'Add some AmazingFeature') - Push в ветку (
git push origin feature/AmazingFeature) - Создайте Pull Request
Этот проект распространяется под лицензией MIT. См. файл LICENSE для подробностей.
Если у вас есть вопросы или предложения, создайте issue в этом репозитории.
Проект создан в качестве тестового задания на вакансию аналитика данных в CSC-HR.