090L
undefined
Data Engineer (Neo4j / Graphs / RAG)
ARGENTINA
Remote
Fulltime
SemiSenior
Data Engineer (Neo4j / Graphs / RAG) · SemiSenior · Remoto · ARG
Ubicación: Argentina
Modalidad: Remoto
Proyecto: Plataforma de inteligencia legal, tributaria y regulatoria
Zona horaria: Argentina
Nivel de inglés: Técnico / lectura de documentación
Conocé Darwoft
En Darwoft creamos software que genera impacto real. Pero somos mucho más que tecnología: somos personas trabajando con propósito, colaboración y ganas de construir soluciones digitales relevantes.
Somos una compañía latinoamericana que trabaja junto a clientes de distintas partes del mundo, desarrollando productos tecnológicos con foco en calidad, escalabilidad e innovación. Muchos nos diferencia por nuestra gran naturalización de la IA.
Trabajamos de manera presencial, remota, colaborativa y con una cultura basada en aprendizaje continuo, evolución, excelencia y cercanía humana.
Sobre el rol
Estamos buscando un/a Data Engineer Ssr ( 3, 4, 5 años de experiencia) con experiencia en Neo4j, Knowledge Graphs y arquitecturas RAG para sumarse a un proyecto de alto impacto vinculado a una plataforma de inteligencia legal, tributaria, contable y regulatoria.
La posición combina responsabilidades propias de Data Engineering —modelado de datos, pipelines de ingesta, transformación, calidad, performance y escalabilidad— con un componente avanzado de modelado semántico en grafos.
El objetivo principal será transformar taxonomías, ontologías y relaciones semánticas definidas por el equipo de Data Science en un modelo de grafos productivo, mantenible y escalable, capaz de alimentar un sistema de recuperación semántica basado en RAG.
Vas a trabajar sobre un ecosistema donde conviven extracción de entidades, procesamiento documental, embeddings, búsqueda vectorial, Neo4j y modelos de recuperación semántica. Es una oportunidad ideal para una persona con base sólida en ingeniería de datos y ganas de profundizar en Knowledge Graphs, GraphRAG y AI-powered search.
Qué vas a hacer
Diseñar, implementar y mantener modelos de datos en Neo4j para representar conceptos, entidades, relaciones semánticas, jerarquías, versiones y dependencias entre contenidos.
Traducir ontologías y taxonomías definidas por el equipo de Data Science en un esquema de grafos eficiente, utilizando labels, relationship types, properties, índices y constraints.
Construir y optimizar pipelines de ingesta hacia Neo4j desde fuentes documentales, extractores de entidades, procesos de NLP, Computer Vision u otros sistemas internos.
Participar en el diseño de flujos de ETL/ELT para carga, transformación, validación y actualización de datos en el grafo.
Implementar estrategias de chunking, generación de embeddings, indexación y recuperación semántica.
Trabajar con Neo4j Vector Index para combinar búsqueda vectorial con recorridos de grafos.
Diseñar soluciones de retrieval híbrido, combinando graph search, vector search, multi-hop retrieval y patrones similares a GraphRAG.
Desarrollar y optimizar consultas avanzadas en Cypher, incluyendo subqueries, patrones complejos, APOC y, cuando aplique, Neo4j GDS.
Optimizar performance de consultas y procesos de carga utilizando EXPLAIN, PROFILE, índices, constraints, page cache y tuning de memoria.
Colaborar con Data Scientists, equipos de extracción de entidades y equipos de desarrollo backend para integrar el grafo con servicios en Node.js o Python.
Definir prácticas de calidad de datos, validaciones, pruebas sobre grafos y monitoreo de consistencia.
Documentar decisiones de modelado, supuestos, trade-offs técnicos y criterios de evolución del modelo.
Contribuir a que la plataforma pueda escalar en volumen, complejidad semántica y necesidades futuras de búsqueda inteligente.
Lo que buscamos
Experiencia sólida como Data Engineer, Data Platform Engineer, Graph Data Engineer o similar.
Experiencia avanzada trabajando con Neo4j, idealmente versión 5.x o superior.
Dominio de Cypher, incluyendo consultas complejas, optimización, subqueries, APOC y buenas prácticas de performance.
Experiencia modelando datos en esquemas tipo property graph para dominios complejos.
Capacidad para transformar modelos conceptuales, taxonomías u ontologías en estructuras de datos productivas.
Experiencia construyendo pipelines de ingesta, transformación, validación y actualización de datos.
Conocimiento práctico de procesos de ETL/ELT y manejo de cargas masivas hacia bases de datos.
Experiencia usando Python o Node.js para integración, automatización o desarrollo de pipelines.
Conocimiento de embeddings, búsqueda semántica, vector search o arquitecturas RAG.
Experiencia trabajando con índices vectoriales o recuperación híbrida.
Buen criterio para diseñar estructuras escalables, mantenibles y observables.
Capacidad para trabajar con equipos interdisciplinarios, especialmente Data Science, Backend, NLP o Computer Vision.
Buen nivel de documentación técnica y comunicación clara para explicar decisiones de modelado a perfiles técnicos y no técnicos.
Autonomía para hacerse dueño/a de un componente técnico desde el diseño hasta la evolución productiva.
Será un plus
Experiencia previa con Knowledge Graphs, GraphRAG o semantic search.
Conocimiento de estándares o enfoques semánticos como SKOS, OWL, RDF, SHACL o modelos ontológicos custom.
Experiencia con Neo4j GDS Library, PageRank, similarity algorithms o graph-based ranking.
Experiencia con frameworks como LangChain, LlamaIndex o Haystack integrados con Neo4j.
Experiencia en dominios legales, tributarios, contables, regulatorios o de compliance.
Conocimiento sobre versionado temporal, jerarquías normativas, vigencia de documentos, relaciones entre normas o estructuras documentales complejas.
Experiencia con herramientas de mensajería o procesamiento distribuido como Kafka o RabbitMQ.
Experiencia con monitoreo y observabilidad usando Prometheus, Grafana, Neo4j Bloom u otras herramientas similares.
Experiencia realizando pruebas sobre datos, queries o grafos mediante golden datasets, tests de Cypher o validaciones automatizadas.
Experiencia desplegando Neo4j en AuraDB, Kubernetes, self-hosted environments, clustering o arquitecturas multi-tenant.
Portfolio, repositorios, papers o casos previos relacionados con grafos, búsqueda semántica o plataformas de datos.
Qué ofrece Darwoft
Contrato full-time en relación de dependencia con pago en ARS
Trabajo 100% remoto
Salario competitivo
Licencias legales y días de vacaciones
Días personales extra por año
Acceso a plataformas de aprendizaje
Tarjeta de beneficios y descuentos
Welcome kit
Programas de reintegro
Clases de inglés
Programa de referidos
Regalo de cumpleaños
Healthy Break
Celebraciones estilo Darwoft: aniversarios, fiestas de fin de año, cumpleaños y actividades de team building
Explore this and other opportunities at:
www.darwoft.com/careers

