Você é uma pessoa movida por dados, apaixonada por transformar desafios complexos em soluções inteligentes e tem brilho nos olhos ao ver o potencial da Inteligência Artificial? Então queremos você para fazer parte dessa jornada! Estamos procurando um talento para o nosso time. Nossa missão é democratizar o marketing digital de alta performance para pequenas e médias empresas, e a IA é a chave para alcançarmos esse objetivo. Se você é uma pessoa proativa, curiosa e com perfil back-end focado em Python ou Node.js, essa vaga é pra você! Seu principal desafio: Você fará parte do desenvolvimento e manutenção de agentes de IA, sendo responsável por todo o ciclo de vida das nossas soluções, desde a concepção e arquitetura até a implementação e monitoramento. No seu dia a dia, você vai: - Projetar, desenvolver e manter agentes de IA, incluindo a gestão de ferramentas, memória, controle de diálogo e orquestração/graph; - Implementar e otimizar pipelines de RAG (Retrieval-Augmented Generation), cuidando da ingestão, chunking, embeddings, busca vetorial e pós-processamento de dados; - Integrar diferentes provedores de LLM, como OpenAI/Azure e Anthropic, via SDK ou REST; - Construir APIs e serviços robustos (REST/GraphQL) utilizando Python (FastAPI) ou Node.js (Express/Nest); - Projetar, operar e otimizar bancos de dados vetoriais (como Pinecone, Weaviate, Qdrant, Milvus ou pgvector) e bancos auxiliares (Postgres, Redis, S3); - Garantir a qualidade e a performance das soluções, escrevendo testes automatizados, monitorando latência, custo, precisão das respostas e instrumentando logs para observabilidade; - Cuidar da segurança das aplicações, incluindo gestão de chaves de API, mitigação de prompt injection, validação de ferramentas e tratamento de dados sensíveis (PII).
Requisitos Experiência profissional em desenvolvimento back-end com Python e/ou Node.js; Experiência prática com LLMs e embeddings (OpenAI/Hugging Face) em projetos reais; Vivência com ao menos um banco de dados vetorial (Pinecone, Weaviate, Qdrant, Milvus ou pgvector); Conhecimento sólido em APIs (FastAPI/Express), versionamento com Git, testes automatizados e CI básico; Experiência com bancos de dados relacionais (especialmente PostgreSQL) e cache (Redis); Inglês técnico para leitura e compreensão de documentações.
Desejável Conhecimento em RAG, incluindo tokenização, chunking, windowing, re-rank e busca híbrida; Experiência com frameworks de orquestração como LangChain, LlamaIndex ou LangGraph; Experiência com vetorização de documentos em escala (ingestão de PDFs, web scraping, OCR); Familiaridade com ferramentas de observabilidade para LLMs (LangSmith, Weights & Biases) e tracing distribuído; Conhecimento em Cloud (AWS/GCP/Azure), Docker e IaC (Terraform).
Benefícios Vale-transporte; Vale-refeição; Plano de saúde; Plano odontológico; Seguro de vida; Apoio psicológico; Total Pass; Auxílio Creche; Convênio com o SESC.
Outras Informações Modelo de trabalho híbrido: 3 dias presenciais em nosso escritório em São Paulo/SP e 2 dias remotos.