Frage im Vorstellungsgespräch bei NVIDIA

How to parallelize matrix multiplication?