Frage im Vorstellungsgespräch bei General Motors (GM)

Derive policy gradient algorithm on the board