Azure Data Engineer/Scientist

Projektkontext

Wir bauen auf Databricks eine Research- und Execution-Plattform für Systematic Equity. Kern ist ein bi-temporaler Feature Store auf Basis der Medaillon-Architektur (Bronze/Silver/Gold) als „Golden Source“ für Signale, Reporting und Applikationen, die Konsolidierung von Legacy-Systemen, performantes Onboarding historischer Marktdaten (45+ Jahre, tägliche Frequenz) sowie ein Compliance-konformer SDLC.

Deine Aufgaben

  • Design & Implementierung eines bi-temporalen EAV-Feature Stores (Versionierung/Vintage zur Vermeidung von Look-Ahead-Bias).
  • Entwicklung inkrementeller/streamender Pipelines auf Databricks Delta Lake für große Zeitreihen.
  • Aufbau eines Security Masters zur quellübergreifenden Asset-Harmonisierung.
  • Umsetzung der Medallion-Architektur: Ingestion, Transformation, Feature-Persistenz.
  • Entwicklung einer Python-Bibliothek für Research/PM (Panel-Abfragen, Integration in Investment-Workflows).
  • Compliance by design: Change-Control, Environment-Separation, Auditability.
  • Performance-Optimierung, Observability/Monitoring, Dokumentation & Knowledge Transfer.

Must-haves

  • 4+ Jahre Data Engineering mit Databricks/Spark (PySpark), Delta Lake, SQL.
  • Nachweisbare Erfahrung mit Zeitreihen/Versionierung (bi-temporal, Valid-From/To, Vintage).
  • Azure-Praxis (Unity Catalog, ADLS, ADF, Identity/Secrets) oder vergleichbare Cloud.
  • Sauberes Engineering: Tests, CI/CD, Packaging, Code-Reviews.
  • Deutsch & Englisch sicher in Wort und Schrift.

Nice-to-haves

  • Finance/Market-Data (z. B. LSEG/Refinitiv, Worldscope) & Security-Master-Konzepte.
  • Power BI/Analytics für Stakeholder-Demos.
  • Erfahrung mit Feature Stores/MLOps und Data-Governance.

Tech-Stack (im Projekt)

Azure, Databricks (Unity Catalog, Delta Lake, Streaming, Spark), Python/PySpark, SQL, Azure Data Factory; Datenquellen: LSEG, Refinitiv, Worldscope/DAL.

Deliverables (erste 3–6 Monate)

  • Feature-Store v1 inkl. Vintage-fähiger Panels und dokumentierter Abfrageschicht.
  • Produktive Ingestion/Transformation (Bronze→Silver→Gold) mit Monitoring.
  • Security-Master-MVP und Mappings über Datenquellen hinweg.
  • Python-Package für Research/PM inkl. Tests & Doku.

Rahmenbedingungen

  • Einsatzort: Remote, gelegentlich Frankfurt a. M.
  • Start: zeitnah
  • Modell: Festanstellung oder Freelance (Vollzeit präferiert)

Dies ist eine Remote-Stelle. Sowohl eine Festanstellung als auch eine freiberufliche Tätigkeit sind möglich.

Vollzeit
Datum
08/10/2025
Ort
Remote work possible
Gehalt
95 000€-135 000€
Close modal window

Vielen Dank für Ihre Bewerbung. Wir werden Sie in Kürze kontaktieren!