LinkedIn Jobs Graph: Como Conectar Pessoas, Habilidades e Oportunidades
Diagrama de um grafo heterogêneo de carreira. Nós de 'Pessoa', 'Vaga', 'Empresa', 'Skill' e 'Curso' estão conectados por arestas como 'possui skill', 'requer skill' e 'ensina skill', mostrando as relações do mercado de trabalho.

Resumo — O LinkedIn vai muito além de conectar pessoas. Sua verdadeira força está em recomendar empregos e, de forma proativa, as habilidades que você precisa aprender. Isso é possível através de um massivo grafo heterogêneo (ou “grafo de carreira”) que conecta Usuários, Habilidades (Skills), Empresas, Vagas e Instituições de Ensino. Este post explora como essa estrutura de grafo permite ao LinkedIn fazer job matching personalizado, analisar skill gaps e sugerir caminhos de carreira.


1. Além do Grafo Social: O Grafo de Carreira

Em um post anterior sobre o “People You May Know”, exploramos como o LinkedIn usa a estrutura do grafo social (amigos de amigos) para sugerir conexões. No entanto, para o seu marketplace de empregos, ele utiliza um tipo de grafo fundamentalmente diferente e mais complexo: um grafo heterogêneo.

Este grafo não conecta apenas pessoas a pessoas. Ele conecta todos os “ativos” do ecossistema profissional:

  • Nós (Entidades de tipos diferentes):
    • Usuário (o profissional)
    • Vaga (a oportunidade de emprego)
    • Empresa (a organização)
    • Skill (a habilidade, ex: “Python”, “GNNs”)
    • Curso/Treinamento (ex: uma certificação)
    • Instituição de Ensino (ex: universidade)
  • Arestas (Relações de tipos diferentes):
    • Usuário \rightarrow Skill (“possui skill”)
    • Vaga \rightarrow Skill (“requer skill”)
    • Usuário \rightarrow Empresa (“trabalhou em”)
    • Empresa \rightarrow Vaga (“oferece vaga”)
    • Curso \rightarrow Skill (“ensina skill”)

O resultado é um imenso Grafo de Conhecimento Profissional que mapeia a dinâmica do mercado de trabalho.

2. Os Problemas Resolvidos por Este Grafo

Ter essa estrutura permite ao LinkedIn responder perguntas muito mais profundas do que um banco de dados relacional conseguiria:

A. Job Matching Personalizado (Link Prediction)

A recomendação “Vagas que talvez sejam do seu interesse” é um problema de link prediction. O sistema tenta prever a probabilidade de uma nova aresta se formar entre você (Usuário) e uma Vaga. Um bom match acontece quando as arestas requer_skill da Vaga têm uma alta sobreposição com as suas arestas possui_skill.

B. Análise de “Skill Gap” (O Elo Perdido)

O grafo é usado não apenas para encontrar o que combina, mas o que falta. O sistema pode identificar: “Você está olhando Vagas de ‘Cientista de Dados Sênior’. Essas vagas frequentemente requerem_skill ‘MLOps’, mas você não possui_skill ‘MLOps’. Talvez você devesse aprender.” Isso é a análise de “elos perdidos” no grafo.

C. Mapeamento de Caminhos de Carreira (Path Analysis)

Como alguém se torna “Diretor de IA”? O LinkedIn pode analisar o grafo: “Pessoas que hoje são Diretor de IA (nós) e que começaram como Engenheiro de Software (nós similares a você), quais foram os caminhos (sequência de arestas) que elas seguiram? Quais Skills elas adquiriram primeiro? Em quais Empresas trabalharam?”. Isso transforma o histórico da rede em um mapa de carreiras.

3. Técnicas: GNNs para Grafos Heterogêneos

Dado que temos um grafo com múltiplos tipos de nós e arestas (heterogêneo), as GNNs tradicionais não são suficientes. Aqui entram arquiteturas especializadas:

  • GNNs Heterogêneas (ex: R-GCN, HAN): São GNNs projetadas para aprender representações (embeddings) diferentes para cada tipo de nó e aresta. Elas aprendem, por exemplo, que a relação possui_skill tem um significado diferente da relação trabalhou_em.
  • Graph Transformers: Como vimos em nosso post sobre Graph Transformers, eles podem ser usados para capturar a compatibilidade complexa entre o “perfil” (um conjunto de nós e arestas) de um candidato e os “requisitos” de uma vaga.

O objetivo dessas técnicas é aprender embeddings de alta qualidade para usuários, vagas e skills, que capturem essa complexa compatibilidade. O score de compatibilidade gerado pela GNN é, então, usado como uma feature poderosa em um modelo de ranking final, que também considera outros fatores (localização, senioridade, salário, probabilidade de resposta do recrutador).

4. Métricas de Sucesso: O Que Define um “Bom Match”?

A eficácia desse sistema não é medida apenas por cliques. As métricas de negócio são mais profundas e alinhadas com o sucesso do usuário:

  • Métricas de Curto Prazo: Click-Through Rate (CTR) em vagas recomendadas; Taxa de Aplicações iniciadas e concluídas.
  • Métricas de Qualidade (Médio Prazo): Taxa de resposta positiva do recrutador (um sinal chave de que o match foi relevante).
  • Métricas de Longo Prazo: Aceitação da proposta de emprego; retenção e sucesso no novo cargo.

5. Riscos e Desafios Éticos: O Viés no Grafo

Usar o histórico de carreira para prever o futuro é incrivelmente poderoso, mas também muito perigoso. O principal risco é o viés (bias):

  • Reforço de Desigualdade: Se o grafo histórico mostra que “pessoas do perfil X (ex: de uma certa universidade, gênero ou etnia) raramente são contratadas para cargos de Liderança Y”, o modelo de GNN aprenderá esse padrão e reforçará ativamente o viés, deixando de recomendar essas vagas para novos candidatos com perfil X.
  • Bolhas de Recomendação: O sistema pode prender usuários em “bolhas” geográficas ou salariais, recomendando apenas vagas parecidas com as que ele já tem, dificultando a transição de carreira ou a descoberta de oportunidades melhores.
  • Privacidade: O grafo pode inferir habilidades que o usuário não declarou explicitamente, ou até mesmo inferir que o usuário está “provavelmente buscando um novo emprego” (com base em quem ele se conecta ou quais skills começa a seguir), o que é uma informação extremamente sensível.

Lidar com fairness (justiça) e privacidade é, talvez, o maior desafio na operação de um grafo de carreira.

Conclusão

O LinkedIn Jobs Graph é um dos exemplos mais sofisticados de um grafo heterogêneo em produção. Ele demonstra como a modelagem de grafos vai muito além da recomendação social (“com quem você quer se conectar?”) para resolver problemas de carreira muito mais profundos: “qual é o seu próximo passo profissional?” e “o que você precisa aprender para chegar lá?”. É a aplicação direta da teoria dos grafos para mapear e navegar no capital humano e no mercado de trabalho.


Referências

As implementações exatas são proprietárias. As referências apontam para os conceitos de GNNs heterogêneas e para o blog de engenharia do LinkedIn, que discute seu “Economic Graph”.

(Knowledge Graphs no LinkedIn): He, X. et al. (2020). Knowledge Graph in Action at LinkedIn: A Case Study. CIKM 2020. (Confirma o uso de KGs para busca e recomendação).

(H-GNNs): Yang, Z. et al. (2020). A Comprehensive Survey on Heterogeneous Graph Neural Networks. arXiv:2011.09190.

(LinkedIn Engineering Blog): O blog oficial onde o LinkedIn discute seus desafios de engenharia, incluindo o “Economic Graph” e sistemas de recomendação e busca. Ex: https://engineering.linkedin.com/blog

Sobre o autor

Rener Menezes
Cofundador & CTO — FitBank

Rener Menezes é cofundador e CTO do FitBank, fintech brasileira de Banking-as-a-Service. Com mais de 25 anos de experiência projetando sistemas financeiros em larga escala, é bacharel em Sistemas de Informação e mestrando na Unifor, onde pesquisa Redes Neurais de Grafos e aprendizado por reforço para detecção de fraude. Interesses: sistemas distribuídos, infraestrutura de pagamentos e graph ML.

Links: LinkedIn · ORCID · contato@grafolab.ia.br

Descubra o poder dos grafos e da IA.

Receba insights, artigos e descobertas sobre Grafos, GNNs e Inteligência Artificial — direto na sua caixa de entrada, uma vez por semana.

Não fazemos spam! Leia nossa política de privacidade para mais informações.

Posted in ,

Deixe uma resposta

Descubra mais sobre GrafoLab

Assine agora mesmo para continuar lendo e ter acesso ao arquivo completo.

Continue reading