Remote-Job

Data & AI Engineer (m/w/d)

Team Passerelle

Quelle: ArbeitnowStandort: Nur DeutschlandVeröffentlicht: 17. Juni 2026Aktiv bestätigt: 17. Juni 2026
VollzeitFinTech

Stellenbeschreibung

Wir sind das Team Passerelle, eine 2025 in Berlin gegründete KI-Beratung aus dem gewerkschaftlichen Umfeld. Unser Name ist Programm: Passerelle bedeutet Brücke. Wir sind angetreten, um inmitten der größten Transformation der Arbeitswelt genau diese Brücke in die Zukunft zu bauen - eine Brücke, die echten technologischen Fortschritt ermöglicht und gleichzeitig bessere Arbeitsbedingungen schafft. All das machen wir unter dem Leitsatz: Gute KI. Gute Arbeit. Gegründet von erfahrenen Köpfen aus der Tech- und Beratungswelt sowie der angewandten KI-Wissenschaft, verbinden wir strategischen C-Level-Weitblick mit tiefem technologischem Sachverstand. Wir begleiten Organisationen und Institutionen auf ihrem Weg in eine KI-geprägte Zukunft, von der strategischen Beratung über die werteorientierte technische Implementierung bis zur nachhaltigen Adoption im Betrieb. Neben unseren Transformationsmandaten entwickeln wir außerdem eigene Software-Produkte für digitale Souveränität. Aufgaben Als Data & AI Engineer schaffst du bei uns die zwingende technische Voraussetzung für jeden erfolgreichen KI-Einsatz: eine belastbare und strukturierte Datenbasis. Dein Schwerpunkt liegt darauf, historisch gewachsene, heterogene Datenlandschaften zu erschließen und für moderne KI-Anwendungen, insbesondere Retrieval-Systeme, nutzbar zu machen. Als eine:r der ersten dedizierten Engineering-Hires gestaltest du den Aufbau unserer technischen Umsetzungskraft mit – eng an der Seite unseres AI Solutions Architect. Dein Tätigkeitsfeld umfasst zwei Bereiche: In unseren Beratungsmandaten analysierst du die bestehende Datenarchitektur, deckst Lücken auf und legst das Fundament für die KI-Strategie. Parallel dazu entwickelst du die Daten- und Retrieval-Pipelines für unsere eigene KI-Infrastruktur und Software-Produkte. ** Deine Aufgaben** • Datenbestandsaufnahme & Reifegrad: Du erstellst Datenlandkarten über heterogene Bestände hinweg und bewertest den Reifegrad des digitalen Fundaments. Deine Lückenanalysen zu Identifikatoren und Metadaten zeigen präzise, wo der Hebel liegt. • AI Data Ingestion (KI-Enablement): Du erschließt unstrukturierte Datenquellen (PDFs, Berichte, Publikationen) für die Nutzung in KI-Systemen – Text-Extraktion, Chunking-Strategien, Metadaten-Generierung, z. B. mit Werkzeugen wie LlamaParse oder Unstructuredio. • Datenfundament & Retrieval: Du entwickelst Metadaten- und Identifikatorkonzepte, Datenmodelle und Embedding-Pipelines und baust die Retrieval-Grundlage für RAG-Anwendungen – inklusive Befüllung und Betrieb von Vektordatenbanken (z. B. Qdrant, Weaviate, pgvector). Die Qualität dieser Grundlage bewertest du systematisch. • Datenschutz & Souveränität: Du gehst verantwortungsvoll mit sensiblen Daten um und stimmst dich eng zu AI-Governance-, Datenschutz, EU AI Act und Souveränitätsanforderungen ab. Datensparsamkeit und Schutzwürdigkeit denkst du von Anfang an mit. • Pipelines für interne Software-Entwicklung: Du baust und betreibst perspektivisch die Ingest- und Retrieval-Pipelines für eigene Software-Produkte – mit DataOps-Mindset (Versioning, Testing, Observability) und einem Verständnis agentischer Muster inkl. Human-in-the-loop. Qualifikation • Fundierte Data-Engineering-Erfahrung: Mehrjährige (3+ Jahre) im Data Engineering oder als Data Platform Engineer – idealerweise in gewachsenen, heterogenen Datenlandschaften. Exzellentes Python und SQL sowie sicherer Umgang mit dem Modern Data Stack (z. B. dbt, Airflow, Dagster) und ETL-/ELT-Prozessen. • KI-Enablement: Praktische Erfahrung mit Embedding-Pipelines und Vektordatenbanken (z. B. Qdrant, Weaviate, Milvus, pgvector), ein Gespür für Retrieval-Strategien und Erfahrung mit der Erschließung unstrukturierter Daten (z. B. LlamaParse, Unstructuredio). • Datenschutz-Bewusstsein: Erfahrung im verantwortungsvollen Umgang mit sensiblen und personenbezogenen Daten sowie Kenntnis der einschlägigen Anforderungen (insb. DSGVO, EU-AI-Act-Awareness). • Pragmatismus bei realer Datenlage: Du fühlst dich in unvollständigen, gewachsenen Datenbeständen wohl und weißt, dass ein nutzbares Datenmodell mehr wert ist als ein perfektes. Du priorisierst, wo es zählt. • Kommunikationsstärke & Haltung: Du übersetzt die Datenrealität verständlich für nicht-technische Stakeholder und kommunizierst auf Augenhöhe mit Fachbereichen. Dein Deutsch und Englisch ist verhandlungssicher. Du steuerst dich selbst, denkst lösungsorientiert und teilst unsere Werte rund um eine gerechte Arbeitswelt von morgen. Schön, wenn du zusätzlich mitbringst: Erfahrung mit Knowledge Graphs, Semantic Layer oder Text-to-SQL; ausgeprägtes DataOps-Mindset; Lust an PoCs mitzubauen Benefits • Echter Impact & Haltung: Ein Arbeitsumfeld, das technologische Innovation mit gesellschaftlicher Verantwortung und nachhaltigen Werten verbindet. Du gestaltest die KI-Transformation an vorderster Front nach europäischen, demokratischen Werten. • Sichtbarkeit & Netzwerk: Einblicke in hochk
RemoteData Scientistberufserfahren

Diese Stelle wird von einer externen Quelle bereitgestellt. Die Bewerbung erfolgt auf der Website der Quelle.

Ähnliche Remote Jobs