Data Engineer (Neo4j / Graphs / RAG)

Data Engineer (Neo4j / Graphs / RAG)

Data Engineer (Neo4j / Graphs / RAG)


Industries

Services

Community

090L

undefined

Data Engineer (Neo4j / Graphs / RAG)

ARGENTINA

Remote

Fulltime

SemiSenior

Data Engineer (Neo4j / Graphs / RAG) · SemiSenior · Remoto · ARG

Ubicación: Argentina
Modalidad: Remoto
Proyecto: Plataforma de inteligencia legal, tributaria y regulatoria
Zona horaria: Argentina
Nivel de inglés: Técnico / lectura de documentación

Conocé Darwoft

En Darwoft creamos software que genera impacto real. Pero somos mucho más que tecnología: somos personas trabajando con propósito, colaboración y ganas de construir soluciones digitales relevantes.

Somos una compañía latinoamericana que trabaja junto a clientes de distintas partes del mundo, desarrollando productos tecnológicos con foco en calidad, escalabilidad e innovación. Muchos nos diferencia por nuestra gran naturalización de la IA.

Trabajamos de manera presencial, remota, colaborativa y con una cultura basada en aprendizaje continuo, evolución, excelencia y cercanía humana.

Sobre el rol

Estamos buscando un/a Data Engineer Ssr ( 3, 4, 5 años de experiencia) con experiencia en Neo4j, Knowledge Graphs y arquitecturas RAG para sumarse a un proyecto de alto impacto vinculado a una plataforma de inteligencia legal, tributaria, contable y regulatoria.

La posición combina responsabilidades propias de Data Engineering —modelado de datos, pipelines de ingesta, transformación, calidad, performance y escalabilidad— con un componente avanzado de modelado semántico en grafos.

El objetivo principal será transformar taxonomías, ontologías y relaciones semánticas definidas por el equipo de Data Science en un modelo de grafos productivo, mantenible y escalable, capaz de alimentar un sistema de recuperación semántica basado en RAG.

Vas a trabajar sobre un ecosistema donde conviven extracción de entidades, procesamiento documental, embeddings, búsqueda vectorial, Neo4j y modelos de recuperación semántica. Es una oportunidad ideal para una persona con base sólida en ingeniería de datos y ganas de profundizar en Knowledge Graphs, GraphRAG y AI-powered search.

Qué vas a hacer

  • Diseñar, implementar y mantener modelos de datos en Neo4j para representar conceptos, entidades, relaciones semánticas, jerarquías, versiones y dependencias entre contenidos.

  • Traducir ontologías y taxonomías definidas por el equipo de Data Science en un esquema de grafos eficiente, utilizando labels, relationship types, properties, índices y constraints.

  • Construir y optimizar pipelines de ingesta hacia Neo4j desde fuentes documentales, extractores de entidades, procesos de NLP, Computer Vision u otros sistemas internos.

  • Participar en el diseño de flujos de ETL/ELT para carga, transformación, validación y actualización de datos en el grafo.

  • Implementar estrategias de chunking, generación de embeddings, indexación y recuperación semántica.

  • Trabajar con Neo4j Vector Index para combinar búsqueda vectorial con recorridos de grafos.

  • Diseñar soluciones de retrieval híbrido, combinando graph search, vector search, multi-hop retrieval y patrones similares a GraphRAG.

  • Desarrollar y optimizar consultas avanzadas en Cypher, incluyendo subqueries, patrones complejos, APOC y, cuando aplique, Neo4j GDS.

  • Optimizar performance de consultas y procesos de carga utilizando EXPLAIN, PROFILE, índices, constraints, page cache y tuning de memoria.

  • Colaborar con Data Scientists, equipos de extracción de entidades y equipos de desarrollo backend para integrar el grafo con servicios en Node.js o Python.

  • Definir prácticas de calidad de datos, validaciones, pruebas sobre grafos y monitoreo de consistencia.

  • Documentar decisiones de modelado, supuestos, trade-offs técnicos y criterios de evolución del modelo.

  • Contribuir a que la plataforma pueda escalar en volumen, complejidad semántica y necesidades futuras de búsqueda inteligente.

Lo que buscamos

  • Experiencia sólida como Data Engineer, Data Platform Engineer, Graph Data Engineer o similar.

  • Experiencia avanzada trabajando con Neo4j, idealmente versión 5.x o superior.

  • Dominio de Cypher, incluyendo consultas complejas, optimización, subqueries, APOC y buenas prácticas de performance.

  • Experiencia modelando datos en esquemas tipo property graph para dominios complejos.

  • Capacidad para transformar modelos conceptuales, taxonomías u ontologías en estructuras de datos productivas.

  • Experiencia construyendo pipelines de ingesta, transformación, validación y actualización de datos.

  • Conocimiento práctico de procesos de ETL/ELT y manejo de cargas masivas hacia bases de datos.

  • Experiencia usando Python o Node.js para integración, automatización o desarrollo de pipelines.

  • Conocimiento de embeddings, búsqueda semántica, vector search o arquitecturas RAG.

  • Experiencia trabajando con índices vectoriales o recuperación híbrida.

  • Buen criterio para diseñar estructuras escalables, mantenibles y observables.

  • Capacidad para trabajar con equipos interdisciplinarios, especialmente Data Science, Backend, NLP o Computer Vision.

  • Buen nivel de documentación técnica y comunicación clara para explicar decisiones de modelado a perfiles técnicos y no técnicos.

  • Autonomía para hacerse dueño/a de un componente técnico desde el diseño hasta la evolución productiva.

Será un plus

  • Experiencia previa con Knowledge Graphs, GraphRAG o semantic search.

  • Conocimiento de estándares o enfoques semánticos como SKOS, OWL, RDF, SHACL o modelos ontológicos custom.

  • Experiencia con Neo4j GDS Library, PageRank, similarity algorithms o graph-based ranking.

  • Experiencia con frameworks como LangChain, LlamaIndex o Haystack integrados con Neo4j.

  • Experiencia en dominios legales, tributarios, contables, regulatorios o de compliance.

  • Conocimiento sobre versionado temporal, jerarquías normativas, vigencia de documentos, relaciones entre normas o estructuras documentales complejas.

  • Experiencia con herramientas de mensajería o procesamiento distribuido como Kafka o RabbitMQ.

  • Experiencia con monitoreo y observabilidad usando Prometheus, Grafana, Neo4j Bloom u otras herramientas similares.

  • Experiencia realizando pruebas sobre datos, queries o grafos mediante golden datasets, tests de Cypher o validaciones automatizadas.

  • Experiencia desplegando Neo4j en AuraDB, Kubernetes, self-hosted environments, clustering o arquitecturas multi-tenant.

  • Portfolio, repositorios, papers o casos previos relacionados con grafos, búsqueda semántica o plataformas de datos.

Qué ofrece Darwoft

  • Contrato full-time en relación de dependencia con pago en ARS

  • Trabajo 100% remoto

  • Salario competitivo

  • Licencias legales y días de vacaciones

  • Días personales extra por año

  • Acceso a plataformas de aprendizaje

  • Tarjeta de beneficios y descuentos

  • Welcome kit

  • Programas de reintegro

  • Clases de inglés

  • Programa de referidos

  • Regalo de cumpleaños

  • Healthy Break

  • Celebraciones estilo Darwoft: aniversarios, fiestas de fin de año, cumpleaños y actividades de team building

Explore this and other opportunities at:
www.darwoft.com/careers

Share it

Share it

Share it

Share it

Let’s Talk /

USA

1050 SW 6th ave. Suite 1100 Portland, OR 97204, US / +1 971 724 7505

ARGENTINA

Jujuy 1412, Cardinales Building

2 Block, 2 Floor, Office 201, 5000 Córdoba

+54 351 881 66 29

COLOMBIA

Calle 10 B #36 -32 El Ático 2 Building

Office 402 - Medellin

+57 302 3281060

Let’s Talk /

USA

1050 SW 6th ave. Suite 1100 Portland, OR 97204, US / +1 971 724 7505

ARGENTINA

Jujuy 1412, Cardinales Building

2 Block, 2 Floor, Office 201, 5000 Córdoba

+54 351 881 66 29

COLOMBIA

Calle 10 B #36 -32 El Ático 2 Building

Office 402 - Medellin

+57 302 3281060