No dinâmico mercado de trabalho atual, recrutadores enfrentam um desafio monumental: analisar centenas, por vezes milhares, de currículos para cada vaga. Este processo manual não é apenas demorado e repetitivo, mas também está sujeito a vieses inconscientes que podem levar à exclusão de talentos promissores. Encontrar o candidato ideal numa pilha de documentos é como procurar uma agulha num palheiro.
Esta ferramenta nasceu para revolucionar a triagem inicial de candidatos. Utilizando o poder do Processamento de Linguagem Natural (NLP) e de modelos de Machine Learning, a nossa aplicação transforma o processo de recrutamento. Ela lê e interpreta os currículos, compara-os de forma inteligente com os requisitos da vaga e gera um score de compatibilidade objetivo e baseado em dados.
O nosso objetivo é claro: libertar o tempo e o talento dos recrutadores. Ao automatizar a triagem, permitimos que os profissionais de RH se foquem no que realmente importa: as interações humanas, as entrevistas estratégicas e a construção de relações com os melhores talentos.
- Análise de Múltiplos Currículos: Faça o upload de vários currículos em formato PDF de uma só vez.
- Score de Compatibilidade Ponderado: Cada candidato recebe um score final baseado em 4 fatores:
- 40% Match de Competências: Análise da presença de palavras-chave.
- 30% Probabilidade do Modelo: Predição de um modelo
RandomForestClassifiertreinado. - 20% Similaridade Textual: Análise de contexto com TF-IDF e Similaridade de Cossenos.
- 10% Aderência Académica: Comparação do nível de formação.
- Dashboard Interativo: Visualize um resumo da análise com gráficos e métricas principais.
- Ranking e Filtros: Classifique os candidatos pelo score e filtre-os por status para uma análise focada.
- Análise Individual Detalhada: Explore um "card" completo para cada candidato com todas as métricas, competências encontradas e em falta.
- Exportação de Resultados: Faça o download dos resultados em formato CSV para relatórios e análises offline.
Interface principal da ferramenta de análise de currículos.
A aplicação foi construída com um conjunto de tecnologias modernas e robustas do ecossistema Python:
-
Interface e Visualização:
- Streamlit: Framework principal para a criação da interface web interativa.
- Plotly Express: Para a criação de gráficos dinâmicos no dashboard.
-
Análise e Manipulação de Dados:
- Pandas: Para a estruturação e manipulação eficiente dos dados.
- NumPy: Essencial para cálculos numéricos e a criação das 'features'.
-
Machine Learning e NLP:
- Scikit-learn: A biblioteca central para o modelo de Machine Learning, pré-processamento e cálculo de similaridade.
- NLTK (Natural Language Toolkit): Usado para o processamento de texto (remoção de 'stopwords').
-
Processamento de Ficheiros:
- PyPDF2: Para a extração de texto diretamente dos ficheiros de currículo em PDF.
Siga os passos abaixo para configurar e executar a aplicação no seu ambiente local.
- Python 3.9 ou superior
pip(gestor de pacotes do Python)
-
Clone o repositório:
git clone https://github.com/Data-Analitycs-Pos-Tech-Fiap/Datathon.git
-
Crie e ative um ambiente virtual (altamente recomendado):
# Para Windows python -m venv venv .\venv\Scripts\activate # Para macOS/Linux python3 -m venv venv source venv/bin/activate
-
Instale as dependências:
pip install -r requirements.txt
Este comando irá instalar todas as bibliotecas necessárias, como Streamlit, Pandas, Scikit-learn, etc.
-
Com o seu ambiente virtual ativado, execute o seguinte comando no terminal:
streamlit run app.py
-
A aplicação será aberta automaticamente no seu navegador web.
Este projeto foi desenvolvido por:
- Kelvyn Candido
- Anderson Silva
- Sandra
- Michael
- Evandro Gardin