DynaPlex (Deep Reinforcement Learning for Data-Driven Logistics)

Projectleider

Dhr. Dr. W.L. van Jaarsveld

Programma manager

Liesbeth Brugemann (brugemann@dinalog.nl)

In december 2018 publiceerde een team van onderzoekers van DeepMind (eigendom van Google) een paper in het tijdschrift Science, waarin het vermogen van hun nieuw ontwikkelde AlphaZero-algoritme wordt aangetoond om versla de beste game-engines in Chess, Go en Shogi. Sterker nog, in plaats van te vertrouwen op handgemaakte evaluatiefuncties van bordstaten, bevat het AlphaZero-algoritme geen expert informatie over een van de gespeelde spellen: het leert autonoom elk spel te spelen, alleen door het spel vaak tegen zichzelf spelen. Deze AI-doorbraak is bijzonder omdat Go en Chess games zijn waarbij het cruciaal is om te anticiperen op onbekende bewegingen van de tegenstander. Bij het nemen van logistieke beslissingen is het evenzeer belangrijk om te anticiperen op de komst van nieuwe gegevens (bijvoorbeeld bestellingen, vertragingen, storingen, enz.).

Voor verschillende dynamische data gestuurde beslissingsproblemen, Deep Reinforcement Learning (DRL)-algoritmen, is het aangetoond dat AlphaZero een game-changers is. De Nederlandse logistieke sector erkent de kansen en staat te popelen om AI te gebruiken voor beslissingsautomatisering.

Echter:
• Bedrijven worstelen om de abstracte mogelijkheden van AI te vertalen naar tastbare projectplannen die nodig zijn om door te gaan naar daadwerkelijke implementaties.
• Het toepassen van op MVO gebaseerde besluitvorming vereist deskundige algoritmische kennis, dat wil zeggen: moeilijk te sourcen.

Onze projectdoelen zijn om tegelijkertijd deze twee uitdagingen te overwinnen:
• We ontwikkelen proofs-of-concept (PoC’s) AI-beslissingsautomatisering voor onze 10 industriële partners, die dienen als concrete voorbeelden van het potentieel van AI in data gestuurde logistiek.
• Op dezelfde manier als AlphaZero is ontworpen als een generiek hulpmiddel om verschillende spellen op te lossen, we creëren de DynaPlex-toolbox om de snelle ontwikkeling van geautomatiseerde beslissingen te ondersteunen maken op basis van DR. DynaPlex richt zich op dynamische data gedreven logistieke uitdagingen, en het is cruciaal bij het leveren van de PoC’s voor partnerbedrijven, terwijl het ook ondersteunt beslissingsautomatisering voor logistieke uitdagingen van bedrijven buiten het consortium.

Het uiteindelijke doel is het ondersteunen van modellering van data gestuurde logistieke beslissingsproblemen in onzekere omgevingen die realtime informatie gebruiken en de toolbox deze problemen laten optimaliseren, met nul codering.

Facts & Figures


Startdatum: 1 mrt 2021
Einddatum: 1 nov 2024