Frage im Vorstellungsgespräch bei TikTok

Why LLM uses Layer Normalization not Batch Normalization