Latest Braintrust news

Blog

How to eval stateful agents

26 June 202615 min

Best practices

Using Braintrust to eval agentic setups from large-scale Hugging Face data

24 June 202627 min

Best practices

How to test agent cost-efficiency with Braintrust

17 June 202610 min

Best practices Product

Date	Title	Tags
16 June 2026 10 min	How to use Braintrust with any framework or provider 16 June 202610 min Best practices	Best practices
4 June 2026 16 min	How we made continuous trace intelligence possible at scale 4 June 202616 min Engineering	Engineering
1 June 2026 2 min	AI observability is active observability 1 June 20262 min Product	Product
1 June 2026 5 min	Automate pattern discovery with Topics, now generally available 1 June 20265 min Product	Product
21 May 2026 9 min	How to improve your golden datasets with human review 21 May 20269 min Best practices	Best practices
21 May 2026 33 min	The six generations of AI agents and how to eval them 21 May 202633 min Best practices	Best practices
14 May 2026 13 min	How to evaluate multi-turn conversations 14 May 202613 min Best practices	Best practices
11 May 2026 4 min	Why your traces and evals belong in the same place 11 May 20264 min Best practices	Best practices
28 April 2026 8 min	How to earn stakeholder trust with evals and observability 28 April 20268 min Best practices	Best practices
13 April 2026 6 min	How to prepare for AI compliance and governance 13 April 20266 min Best practices	Best practices
8 April 2026 5 min	Agentic eval development with the Braintrust CLI 8 April 20265 min Engineering	Engineering
6 April 2026 11 min	How Brainstore works: architecture for AI observability at scale 6 April 202611 min Engineering	Engineering
3 April 2026 4 min	Braintrust CLI and MCP 3 April 20264 min Product	Product
27 March 2026 9 min	Evals are the new PRD 27 March 20269 min Best practices	Best practices
19 March 2026 8 min	What is AI observability? 19 March 20268 min Best practices	Best practices
17 March 2026 10 min	Evals for PMs: A practical guide to AI product quality 17 March 202610 min Best practices	Best practices
Mar 16, 2026 4 min	Keep building with the Starter plan Mar 16, 20264 min Product	Product
12 March 2026 4 min	Supporting privacy and compliance for EU teams 12 March 20264 min Product	Product
10 March 2026 17 min	How to build your first offline eval 10 March 202617 min Best practices	Best practices
25 February 2026 4 min	Automatically discover what matters in your production traces with Topics 25 February 20264 min Product	Product
25 February 2026 7 min	Trace keynote recap: See it, improve it, optimize it 25 February 20267 min Product	Product
17 February 2026 4 min	Braintrust's series B: building the infrastructure for production AI 17 February 20264 min Company	Company
12 February 2026 15 min	The 5 pillars of AI model performance 12 February 202615 min Best practices	Best practices
22 January 2026 5 min	Testing if "bash is all you need" 22 January 20265 min Engineering	Engineering
Jan 21, 2026 3 min	Security is a choice: how Braintrust lets you decide where your AI data lives Jan 21, 20263 min Product	Product
Jan 20, 2026 6 min	Building observable AI agents with Temporal Jan 20, 20266 min Engineering	Engineering
13 January 2026 7 min	Debugging Ralph Wiggum with Braintrust Logs 13 January 20267 min Product	Product
23 December 2025 2 min	Claude Code meets Braintrust 23 December 20252 min Engineering	Engineering
22 December 2025 3 min	AI observability beyond Python and TypeScript 22 December 20253 min Engineering	Engineering
18 December 2025 3 min	Brainstore makes AI observability at scale possible 18 December 20253 min Product	Product
25 November 2025 8 min	Evals are a team sport: How we built Loop 25 November 20258 min Product Best practices	Product Best practices
24 November 2025 5 min	Turn production data into better AI with Loop 24 November 20255 min Product	Product
18 November 2025 8 min	The three pillars of AI observability 18 November 20258 min Best practices	Best practices
23 October 2025 4 min	Braintrust Java SDK: AI observability and evals for the JVM 23 October 20254 min Product Engineering Best practices	Product Engineering Best practices
16 October 2025 4 min	Braintrust on the Vercel Marketplace 16 October 20254 min Product	Product
10 October 2025 9 min	Measuring what matters: An intro to AI evals 10 October 20259 min Best practices	Best practices
29 September 2025 5 min	Claude Sonnet 4.5 analysis 29 September 20255 min Best practices	Best practices
9 September 2025 3 min	AI that knows your data 9 September 20253 min Product	Product
3 September 2025 4 min	A/B testing can't keep up with AI 3 September 20254 min Best practices	Best practices
19 August 2025 5 min	The rise of async programming 19 August 20255 min Best practices	Best practices
8 August 2025 5 min	GPT-5 vs. Claude Opus 4.1 8 August 20255 min Product	Product
7 August 2025 7 min	The canonical agent architecture: A while loop with tools 7 August 20257 min Engineering	Engineering
17 July 2025 5 min	Five hard-learned lessons about AI evals 17 July 20255 min Best practices	Best practices
14 July 2025 7 min	Braintrust is not an eval framework 14 July 20257 min Product	Product
11 July 2025 9 min	Building with Grok 4 11 July 20259 min Product	Product
3 June 2025 7 min	Experiments UI: Now 10x faster 3 June 20257 min Engineering	Engineering
27 May 2025 3 min	Eval playgrounds for faster, focused iteration 27 May 20253 min Product	Product
22 April 2025 4 min	Webinar recap: Eval best practices 22 April 20254 min Best practices	Best practices
3 April 2025 4 min	Resilient observability by design 3 April 20254 min Engineering	Engineering
31 March 2025 4 min	Brainstore is now on by default 31 March 20254 min Product	Product
3 March 2025 10 min	Brainstore: the database designed for the AI engineering era 3 March 202510 min Product	Product
14 February 2025 2 min	Bedrock, Vertex AI, and universal structured outputs 14 February 20252 min Product	Product
22 January 2025 28 min	Evaluating agents 22 January 202528 min Best practices	Best practices
8 January 2025 4 min	Our approach to hybrid deployment 8 January 20254 min Product	Product
31 December 2024 3 min	The top 10 most loved features of 2024 31 December 20243 min Product	Product
18 December 2024 2 min	New monitor page for easy analytics 18 December 20242 min Product	Product
4 December 2024 3 min	What to do when a new AI model comes out 4 December 20243 min Best practices	Best practices
18 November 2024 7 min	Building a RAG app with MongoDB Atlas 18 November 20247 min Best practices	Best practices
14 November 2024 5 min	Evaluating Gemini models for vision 14 November 20245 min Product	Product
13 November 2024 2 min	Python tool functions: powered by uv 13 November 20242 min Product	Product
4 November 2024 6 min	Building serverless apps with the OpenAI Realtime API 4 November 20246 min Product	Product
24 October 2024 3 min	Logging with attachments 24 October 20243 min Product	Product
17 October 2024 6 min	I ran an eval. Now what? 17 October 20246 min Best practices	Best practices
8 October 2024 3 min	Announcing our $36M Series A 8 October 20243 min Company	Company
8 October 2024 6 min	Functions: flexible AI engineering primitives 8 October 20246 min Product	Product
16 September 2024 3 min	Custom scoring functions in the Braintrust Playground 16 September 20243 min Product	Product
15 July 2024 1 min	Braintrust achieves SOC 2 Type II compliance 15 July 20241 min Company	Company
20 June 2024 6 min	How to improve your evaluations 20 June 20246 min Best practices	Best practices
6 May 2024 5 min	AI development loops 6 May 20245 min Best practices	Best practices
24 April 2024 5 min	Getting started with automated evaluations 24 April 20245 min Best practices	Best practices
17 April 2024 6 min	Eval feedback loops 17 April 20246 min Best practices	Best practices
9 April 2024 1 min	Braintrust selected to be in the Enterprise Tech 30 9 April 20241 min Company	Company
21 December 2023 1 min	2023, a year in review 21 December 20231 min Product	Product
13 December 2023 4 min	Braintrust's seed round: $5m to build infrastructure for AI products 13 December 20234 min Company	Company
27 November 2023 3 min	Open sourcing the AI proxy 27 November 20233 min Engineering	Engineering
20 November 2023 7 min	AI proxy: fostering a more open ecosystem 20 November 20237 min Product	Product
15 November 2023 2 min	State of AI development 2023 15 November 20232 min Company	Company
13 November 2023 5 min	The AI product development journey 13 November 20235 min Best practices	Best practices
12 September 2023 6 min	It's time to build reliable AI 12 September 20236 min Company	Company

Trace everything

Create an account or use agent setup to start building today.