AI Papers Academy

@UCjqDDqUh1DgjrlNjLR5p8nw - 35K subscribers

Simplifying AI Papers

Home Videos Live Playlists

The End of Frozen LLMs? (Google’s Hope Explained)

The End of Frozen LLMs? (Google’s Hope Explained) AI Papers Academy

5.7K views - 1 day ago

GDPO Explained: NVIDIA Fixes GRPO for LLM Reinforcement Learning

GDPO Explained: NVIDIA Fixes GRPO for LLM Reinforcement Learning AI Papers Academy

3.3K views - 3 months ago

mHC Explained: How DeepSeek Rewires LLMs for 2026

mHC Explained: How DeepSeek Rewires LLMs for 2026 AI Papers Academy

28.3K views - 3 months ago

Why Reinforcement Learning Unlocks Reasoning in LLMs (Aha Moments Explained)

Why Reinforcement Learning Unlocks Reasoning in LLMs (Aha Moments Explained) AI Papers Academy

2.5K views - 3 months ago

Tiny Recursive Model (TRM) Paper Explained

Tiny Recursive Model (TRM) Paper Explained AI Papers Academy

9.8K views - 6 months ago

DINOv3 Paper Explained: The Computer Vision Foundation Model

DINOv3 Paper Explained: The Computer Vision Foundation Model AI Papers Academy

18.1K views - 7 months ago

The Era of Hierarchical Reasoning Models

The Era of Hierarchical Reasoning Models AI Papers Academy

9.4K views - 8 months ago

Reinforcement Pre-Training (RPT) By Microsoft Explained

Reinforcement Pre-Training (RPT) By Microsoft Explained AI Papers Academy

2.5K views - 9 months ago

Darwin Gödel Machine Explained: Self-Improving AI Agents

Darwin Gödel Machine Explained: Self-Improving AI Agents AI Papers Academy

4.5K views - 10 months ago

Continuous Thought Machines (CTMs) - The Era of AI Beyond Transformers?

Continuous Thought Machines (CTMs) - The Era of AI Beyond Transformers? AI Papers Academy

11.4K views - 10 months ago

Perception Language Models (PLMs) by Meta – A Fully Open SOTA VLM

Perception Language Models (PLMs) by Meta – A Fully Open SOTA VLM AI Papers Academy

7.9K views - 11 months ago

GRPO Reinforcement Learning Explained (DeepSeekMath Paper)

GRPO Reinforcement Learning Explained (DeepSeekMath Paper) AI Papers Academy

5.4K views - 1 year ago

GRPO 2.0? DAPO LLM Reinforcement Learning Explained

GRPO 2.0? DAPO LLM Reinforcement Learning Explained AI Papers Academy

6.4K views - 1 year ago

Cheating LLMs & How (Not) To Stop Them | OpenAI Paper Explained

Cheating LLMs & How (Not) To Stop Them | OpenAI Paper Explained AI Papers Academy

2.5K views - 1 year ago

START by Alibaba: Teaching LLMs to Debug Their Thinking with Python

START by Alibaba: Teaching LLMs to Debug Their Thinking with Python AI Papers Academy

2.5K views - 1 year ago

SWE-RL by Meta — Reinforcement Learning for Software Engineering LLMs

SWE-RL by Meta — Reinforcement Learning for Software Engineering LLMs AI Papers Academy

3K views - 1 year ago

Large Language Diffusion Models - The Era Of Diffusion LLMs?

Large Language Diffusion Models - The Era Of Diffusion LLMs? AI Papers Academy

23.9K views - 1 year ago

CoCoMix by Meta AI - The Future of LLMs Pretraining?

CoCoMix by Meta AI - The Future of LLMs Pretraining? AI Papers Academy

5.8K views - 1 year ago

s1: Simple Test-Time Scaling - Can 1k Samples Rival o1-Preview?

s1: Simple Test-Time Scaling - Can 1k Samples Rival o1-Preview? AI Papers Academy

6K views - 1 year ago

DeepSeek Janus-Pro: DeepSeek's Revolution in Multimodal AI?

DeepSeek Janus-Pro: DeepSeek's Revolution in Multimodal AI? AI Papers Academy

9.2K views - 1 year ago

DeepSeek-R1 Paper Explained - A New RL LLMs Era in AI?

DeepSeek-R1 Paper Explained - A New RL LLMs Era in AI? AI Papers Academy

84.6K views - 1 year ago

Titans by Google: The Era of AI After Transformers?

Titans by Google: The Era of AI After Transformers? AI Papers Academy

34.6K views - 1 year ago

rStar-Math by Microsoft: Can SLMs Beat OpenAI o1 in Math?

rStar-Math by Microsoft: Can SLMs Beat OpenAI o1 in Math? AI Papers Academy

5.3K views - 1 year ago

Large Concept Models (LCMs) by Meta: The Era of AI After LLMs?

Large Concept Models (LCMs) by Meta: The Era of AI After LLMs? AI Papers Academy

39K views - 1 year ago

Byte Latent Transformer (BLT) by Meta AI - A Tokenizer-free LLM

Byte Latent Transformer (BLT) by Meta AI - A Tokenizer-free LLM AI Papers Academy

13.3K views - 1 year ago

Coconut by Meta AI - LLM Reasoning With Chain of Continuous Thought

Coconut by Meta AI - LLM Reasoning With Chain of Continuous Thought AI Papers Academy

9.9K views - 1 year ago

Hymba by NVIDIA: A Hybrid Mamba-Transformer SOTA Small LM

Hymba by NVIDIA: A Hybrid Mamba-Transformer SOTA Small LM AI Papers Academy

3.9K views - 1 year ago

LLaMA-Mesh by Nvidia: LLM for 3D Mesh Generation

LLaMA-Mesh by Nvidia: LLM for 3D Mesh Generation AI Papers Academy

16.9K views - 1 year ago

Tokenformer: The Next Generation of Transformers?

Tokenformer: The Next Generation of Transformers? AI Papers Academy

12.1K views - 1 year ago

Generative Reward Models: Merging the Power of RLHF and RLAIF for Smarter AI

Generative Reward Models: Merging the Power of RLHF and RLAIF for Smarter AI AI Papers Academy

2.2K views - 1 year ago

Writing in the Margins: Better LLM Inference Pattern for Long Context Retrieval

Writing in the Margins: Better LLM Inference Pattern for Long Context Retrieval AI Papers Academy

991 views - 1 year ago

Sapiens by Meta AI: Foundation for Human Vision Models

Sapiens by Meta AI: Foundation for Human Vision Models AI Papers Academy

4.5K views - 1 year ago

Mixture of Nested Experts by Google: Efficient Alternative To MoE?

Mixture of Nested Experts by Google: Efficient Alternative To MoE? AI Papers Academy

1.1K views - 1 year ago

Introduction to Mixture-of-Experts | Original MoE Paper Explained

Introduction to Mixture-of-Experts | Original MoE Paper Explained AI Papers Academy

12.8K views - 1 year ago

Mixture-of-Agents (MoA) Enhances Large Language Model Capabilities

Mixture-of-Agents (MoA) Enhances Large Language Model Capabilities AI Papers Academy

3.4K views - 1 year ago

Arithmetic Transformers with Abacus Positional Embeddings | AI Paper Explained

Arithmetic Transformers with Abacus Positional Embeddings | AI Paper Explained AI Papers Academy

948 views - 1 year ago

CLLMs: Consistency Large Language Models | AI Paper Explained

CLLMs: Consistency Large Language Models | AI Paper Explained AI Papers Academy

1.4K views - 1 year ago

ReFT: Representation Finetuning for Language Models | AI Paper Explained

ReFT: Representation Finetuning for Language Models | AI Paper Explained AI Papers Academy

3.9K views - 2 years ago

Stealing Part of a Production Language Model | AI Paper Explained

Stealing Part of a Production Language Model | AI Paper Explained AI Papers Academy

2.1K views - 2 years ago

The Era of 1-bit LLMs by Microsoft | AI Paper Explained

The Era of 1-bit LLMs by Microsoft | AI Paper Explained AI Papers Academy

96.5K views - 2 years ago

V-JEPA by Meta AI - A Human-Like Computer Vision Video-based Model

V-JEPA by Meta AI - A Human-Like Computer Vision Video-based Model AI Papers Academy

11.4K views - 2 years ago

Self-Rewarding Language Models by Meta AI - Path to Open-Source AGI?

Self-Rewarding Language Models by Meta AI - Path to Open-Source AGI? AI Papers Academy

4.2K views - 2 years ago

Fast Inference of Mixture-of-Experts Language Models with Offloading

Fast Inference of Mixture-of-Experts Language Models with Offloading AI Papers Academy

2K views - 2 years ago

TinyGPT-V: Small but Mighty Multimodal Large Language Model

TinyGPT-V: Small but Mighty Multimodal Large Language Model AI Papers Academy

2K views - 2 years ago

LLM in a flash: Efficient Large Language Model Inference with Limited Memory

LLM in a flash: Efficient Large Language Model Inference with Limited Memory AI Papers Academy

4.8K views - 2 years ago

Vision Transformers Explained | The ViT Paper

Vision Transformers Explained | The ViT Paper AI Papers Academy

10.4K views - 2 years ago

Orca 2 by Microsoft: Teaching Small Language Models How to Reason

Orca 2 by Microsoft: Teaching Small Language Models How to Reason AI Papers Academy

2.4K views - 2 years ago

LCM-LoRA: From Diffusion Models to Fast SDXL with Latent Consistency Models

LCM-LoRA: From Diffusion Models to Fast SDXL with Latent Consistency Models AI Papers Academy

4K views - 2 years ago

CODEFUSION by Microsoft: A Pre-trained Diffusion Model for Code Generation

CODEFUSION by Microsoft: A Pre-trained Diffusion Model for Code Generation AI Papers Academy

1.4K views - 2 years ago

Table-GPT by Microsoft: Empower LLMs To Understand Tables

Table-GPT by Microsoft: Empower LLMs To Understand Tables AI Papers Academy

9K views - 2 years ago

Vision Transformers Need Registers - Fixing a Bug in DINOv2?

Vision Transformers Need Registers - Fixing a Bug in DINOv2? AI Papers Academy

4.3K views - 2 years ago

Emu by Meta AI: Enhancing Image Generation Models Using Photogenic Needles in a Haystack

Emu by Meta AI: Enhancing Image Generation Models Using Photogenic Needles in a Haystack AI Papers Academy

923 views - 2 years ago

NExT-GPT: Any-to-Any Multimodal LLM

NExT-GPT: Any-to-Any Multimodal LLM AI Papers Academy

8.1K views - 2 years ago

Large Language Models As Optimizers - OPRO by Google DeepMind

Large Language Models As Optimizers - OPRO by Google DeepMind AI Papers Academy

3.9K views - 2 years ago

FACET by Meta AI - Fairness in Computer Vision Evaluation Benchmark

FACET by Meta AI - Fairness in Computer Vision Evaluation Benchmark AI Papers Academy

587 views - 2 years ago

Code Llama Paper Explained

Code Llama Paper Explained AI Papers Academy

2.4K views - 2 years ago

WizardMath from Microsoft - Best Open Source Math LLM with Reinforced Evol-Instruct

WizardMath from Microsoft - Best Open Source Math LLM with Reinforced Evol-Instruct AI Papers Academy

4.1K views - 2 years ago

Shepherd by Meta AI - A Critic for Large Language Models

Shepherd by Meta AI - A Critic for Large Language Models AI Papers Academy

792 views - 2 years ago

Soft Mixture of Experts - An Efficient Sparse Transformer

Soft Mixture of Experts - An Efficient Sparse Transformer AI Papers Academy

5.7K views - 2 years ago

Universal and Transferable LLM Attacks - A New Threat to AI Safety

Universal and Transferable LLM Attacks - A New Threat to AI Safety AI Papers Academy

3.5K views - 2 years ago