Azure Data Engineer/Scientist
Projektkontext
Wir bauen auf Databricks eine Research- und Execution-Plattform für Systematic Equity. Kern ist ein bi-temporaler Feature Store auf Basis der Medaillon-Architektur (Bronze/Silver/Gold) als „Golden Source“ für Signale, Reporting und Applikationen, die Konsolidierung von Legacy-Systemen, performantes Onboarding historischer Marktdaten (45+ Jahre, tägliche Frequenz) sowie ein Compliance-konformer SDLC.
Deine Aufgaben
- Design & Implementierung eines bi-temporalen EAV-Feature Stores (Versionierung/Vintage zur Vermeidung von Look-Ahead-Bias).
- Entwicklung inkrementeller/streamender Pipelines auf Databricks Delta Lake für große Zeitreihen.
- Aufbau eines Security Masters zur quellübergreifenden Asset-Harmonisierung.
- Umsetzung der Medallion-Architektur: Ingestion, Transformation, Feature-Persistenz.
- Entwicklung einer Python-Bibliothek für Research/PM (Panel-Abfragen, Integration in Investment-Workflows).
- Compliance by design: Change-Control, Environment-Separation, Auditability.
- Performance-Optimierung, Observability/Monitoring, Dokumentation & Knowledge Transfer.
Must-haves
- 4+ Jahre Data Engineering mit Databricks/Spark (PySpark), Delta Lake, SQL.
- Nachweisbare Erfahrung mit Zeitreihen/Versionierung (bi-temporal, Valid-From/To, Vintage).
- Azure-Praxis (Unity Catalog, ADLS, ADF, Identity/Secrets) oder vergleichbare Cloud.
- Sauberes Engineering: Tests, CI/CD, Packaging, Code-Reviews.
- Deutsch & Englisch sicher in Wort und Schrift.
Nice-to-haves
- Finance/Market-Data (z. B. LSEG/Refinitiv, Worldscope) & Security-Master-Konzepte.
- Power BI/Analytics für Stakeholder-Demos.
- Erfahrung mit Feature Stores/MLOps und Data-Governance.
Tech-Stack (im Projekt)
Azure, Databricks (Unity Catalog, Delta Lake, Streaming, Spark), Python/PySpark, SQL, Azure Data Factory; Datenquellen: LSEG, Refinitiv, Worldscope/DAL.
Deliverables (erste 3–6 Monate)
- Feature-Store v1 inkl. Vintage-fähiger Panels und dokumentierter Abfrageschicht.
- Produktive Ingestion/Transformation (Bronze→Silver→Gold) mit Monitoring.
- Security-Master-MVP und Mappings über Datenquellen hinweg.
- Python-Package für Research/PM inkl. Tests & Doku.
Rahmenbedingungen
- Einsatzort: Remote, gelegentlich Frankfurt a. M.
- Start: zeitnah
- Modell: Festanstellung oder Freelance (Vollzeit präferiert)
Dies ist eine Remote-Stelle. Sowohl eine Festanstellung als auch eine freiberufliche Tätigkeit sind möglich.
Vollzeit
Datum
08/10/2025
Ort
Remote work possible
Gehalt
95 000€-135 000€