Best AI papers explained
Een podcast door Enoch H. Kang - Donderdagen

Categorieën:
190 Afleveringen
-
Instacart's Economics Team: A Hybrid Role in Tech
Gepubliceerd: 31-3-2025 -
Data Mixture Optimization: A Multi-fidelity Multi-scale Bayesian Framework
Gepubliceerd: 31-3-2025 -
Why MCP won
Gepubliceerd: 31-3-2025 -
SWEET-RL: Training LLM Agents for Collaborative Reasoning
Gepubliceerd: 31-3-2025 -
TheoryCoder: Bilevel Planning with Synthesized World Models
Gepubliceerd: 30-3-2025 -
Driving Forces in AI: Scaling to 2025 and Beyond (Jason Wei, OpenAI)
Gepubliceerd: 29-3-2025 -
Expert Demonstrations for Sequential Decision Making under Heterogeneity
Gepubliceerd: 28-3-2025 -
TextGrad: Backpropagating Language Model Feedback for Generative AI Optimization
Gepubliceerd: 27-3-2025 -
MemReasoner: Generalizing Language Models on Reasoning-in-a-Haystack Tasks
Gepubliceerd: 27-3-2025 -
RAFT: In-Domain Retrieval-Augmented Fine-Tuning for Language Models
Gepubliceerd: 27-3-2025 -
Inductive Biases for Exchangeable Sequence Modeling
Gepubliceerd: 26-3-2025 -
InverseRLignment: LLM Alignment via Inverse Reinforcement Learning
Gepubliceerd: 26-3-2025 -
Prompt-OIRL: Offline Inverse RL for Query-Dependent Prompting
Gepubliceerd: 26-3-2025 -
Alignment from Demonstrations for Large Language Models
Gepubliceerd: 25-3-2025 -
Q♯: Distributional RL for Optimal LLM Post-Training
Gepubliceerd: 18-3-2025 -
Scaling Test-Time Compute Without Verification or RL is Suboptimal
Gepubliceerd: 14-3-2025 -
Optimizing Test-Time Compute via Meta Reinforcement Fine-Tuning
Gepubliceerd: 14-3-2025 -
Optimizing Test-Time Compute via Meta Reinforcement Fine-Tuning
Gepubliceerd: 14-3-2025 -
Open Problems and Fundamental Limitations of Reinforcement Learning from Human Feedback
Gepubliceerd: 14-3-2025 -
Revisiting Superficial Alignment Hypothesis
Gepubliceerd: 14-3-2025
Men know other men best. Women know other women best. And yes, perhaps AIs know other AIs best. AI explains what you should know about this week's AI research progress.