Elijah Kurien

Deconstructing Metal Kernels from OpenAI’s GPT-oss

Learn to write performant kernels in Metal Shader Langauge

Breaking down how torch.compile() optimizes large models