Westhouse ist eines der führenden internationalen Recruitment Unternehmen für die Vermittlung von hochqualifizierten Fachexperten in Bereichen wie IT Life Cycle, SAP, Engineering, Kaufmännischem und Fachberatung.
Für unseren Kunden suchen wir aktuell eine/n Senior RL‑Spezialist (Reinforcement Learning) (m/w/d) - Remote (75%) & München.
Ihre Aufgaben
Verantwortung für die methodische und technische Ausgestaltung der RL-LösungKonzeption und Ausgestaltung der Exploration und Bandit-VerhaltensGestaltung und Implementierung von Exploration GroupsEntwicklung und Implementierung von RL-SimulationsmodellenDurchführung und Betreuung von Off-Policy-EvaluationsDefinition und Auswahl geeigneter Bandit-Methodiken, z. B.: Thompson Sampling, Epsilon-Greedy, Upper Confidence Bound (UCB))Fachliche Absicherung des Bandit-Livegangs Interessiert?
Paul Schock
Tel.:
<...