Requisitos Experiência profissional em desenvolvimento back-end com Python e/ou Node.js; Experiência prática com LLMs e embeddings (OpenAI/Hugging Face) em projetos reais; Vivência com ao menos um banco de dados vetorial (Pinecone, Weaviate, Qdrant, Milvus ou pgvector); Conhecimento sólido em APIs (FastAPI/Express), versionamento com Git, testes automatizados e CI básico; Experiência com bancos de dados relacionais (especialmente PostgreSQL) e cache (Redis); Inglês técnico para leitura e compreensão de documentações.
Desejável Conhecimento em RAG, incluindo tokenização, chunking, windowing, re-rank e busca híbrida; Experiência com frameworks de orquestração como LangChain, LlamaIndex ou LangGraph; Experiência com vetorização de documentos em escala (ingestão de PDFs, web scraping, OCR); Familiaridade com ferramentas de observabilidade para LLMs (LangSmith, Weights & Biases) e tracing distribuído; Conhecimento em Cloud (AWS/GCP/Azure), Docker e IaC (Terraform).
Benefícios Vale-transporte; Vale-refeição; Plano de saúde; Plano odontológico; Seguro de vida; Apoio psicológico; Total Pass; Auxílio Creche; Convênio com o SESC.
Outras Informações Modelo de trabalho híbrido: 3 dias presenciais em nosso escritório em São Paulo/SP e 2 dias remotos.
Report job