Data Engineer

Amsterdam/hybride Deadline: 12-06-2026 Posted: 05-06-2026 #16939

Het RMDM-realisatieteam (Data Services) ontwikkelt de RMDM-Hub: een centrale voorziening die (relatie)masterdata uit in- en externe bronsystemen (o.a. ECB/EIOPA/CBS) verzamelt, vergelijkt en certificeert. De Hub maakt datakwaliteit inzichtelijk voor data stewards en stelt gecertificeerde relatiemasterdatasets beschikbaar aan in- en externe afnemers. Als Data Engineer Masterdata ontwerp en realiseer je de MDM-dataketens en datafuncties van de RMDM-Hub op basis van het masterdatamodel en het data quality framework. Je realiseert de solution-architectuur met Azure Synapse, Delta Lake, Azure Storage Accounts, Power BI en Apache Spark. Je ontwikkelt zowel de backend van het dataplatform als dashboards. Je werkt volgens DevOps-principes (you build it, you run it) en zet met Azure DevOps en YAML automatische deployments/pipelines op; infrastructuur wordt door het team uitgerold (o.a. met BICEP/YAML/PowerShell). Op termijn gaat het platform over op Microsoft Fabric en/of Databricks.

We zitten in de afrondende fase van de RMDM Roadmap: de komende 6 tot 12 maanden ronden we de realisatie af zover mogelijk af, stabiliseren we de oplossing en bereiden we de overdracht naar intern beheer en doorontwikkeling voor. Daarom zoeken we een data engineer die de RMDM-dataketens en datafuncties van de RMDM-Hub verder afbouwt en productie-/beheer-ready maakt. Je vertaalt de solutionarchitectuur naar werkende oplossingen op Azure en werkt nauw samen met developer, collega dataengineers, analisten, Product Owner in een 3-wekelijks sprintritme.

Je bouwt datalakehouse-oplossingen en datamodellen (o.a. Ralph Kimball dimensioneel model) en implementeert datakwaliteitscontroles op basis van geautomatiseerde regels. In deze fase ligt de nadruk op afronden en stabiliseren: het harden van pipelines en dataflows, verbeteren van monitoring/alerting, documentatie en runbooks, en het automatiseren van deployments (CI/CD) zodat de oplossing daarna duurzaam in beheer genomen kan worden. Je werkt met SQL, PySpark/Python en Azure Data Factory en levert rapportages/dashboards in Power BI (incl. DAX/Analysis Services waar nodig). Je borgt kwaliteit via testen, pipelines en quality control binnen de DNB Way-of-Working en draagt kennis actief over aan beheer- en supportpartijen.

Eisen

  • Beschikbaar van 24-07-2026 voor 5 maanden, 36 uur per week, met optie op verlenging 
  • HBO/WO werk- en denkniveau
  • Minimaal 3 jaar relevante werkervaring als data engineer in Azure (bij voorkeur 5 jaar).
  • Minimaal 3 jaar relevante werkervaring met Python, Azure SQL en/of SQL Server.
  • Minimaal 3 jaar relevante werkervaring met Apache Spark.
  • Minimaal 2 jaar relevante werkervaring met Azure Synapse.
  • Minimaal 3 jaar ervaring met Power BI, DAX en/of Analysis Services.
  • Ervaring met werken in een Agile/Scrum team en met CI/CD.
  • Ervaring met het stabiliseren van productieomgevingen (bugfixing, performance, beheerbaarheid) en overdracht naar beheer
  • Minimaal 5 jaar relevante ICT-werkervaring in een grote organisatie (> 1.000 medewerkers), bij voorkeur overheid en/of financiele dienstverlener.
  • Minimaal 1 jaar ervaring met datalakehousearchitectuur en dimensioneel modelleren (Ralph Kimball).

Wensen

  • Kennis van het opleveren van beheerbare software (documentatie/runbooks).
  • Minimaal 2 jaar ervaring met Azure DevOps (boards, repos, build/release pipelines), deployment-automatisering, testautomatisering (unit/integratie/e2e) en kwaliteitsborging via code reviews en pipelines.
  • Minimaal 2 jaar ervaring met Azure Data Factory, Microsft Fabric en/ Databricks en automatiseren van deployments en infra-uitrol met Azure DevOps, YAML, Bicep, Powershell.
  • Bij ten minste één opdracht aantoonbare ervaring opgedaan met het realiseren van een centrale masterdatahub, waaronder het ontwerpen, bouwen en beheren van schaalbare en herleidbare datapipelines en integraties voor het verwerken, valideren, verrijken en distribueren van masterdata, in samenwerking met architecten, data stewards, analisten en afnemende teams binnen een complexe dataen ketenomgeving.
  • Kennis van testframeworks en testautomatisering (unit/integratie/e2e)
  • Kennis van relatiemasterdata-concepten en RMDM-datamodellering (o.a. identifiers, authoritative/golden record, matching & deduplicatie, historie/tijdlijnen met geldigheid, sleutelbeheer/registry tables) en de samenhang met relevante interne/externe bronnen

 

Apply for this position

Back