Fugu

Sakana AI · Fugu. Released Jun 15, 2026.

Fugu is a model from Sakana AI in the Fugu family, released Jun 15, 2026. evals.report tracks 7 reported Fugu benchmark scores across SWE-bench Pro, Terminal-Bench 2.1, Humanity's Last Exam, GPQA Diamond, CharXiv, SciCode, LiveCodeBench — each shown with its benchmark, metric, source status, and date, and never combined into a single ranking.

7 results

Benchmark results 7

Compare this model

Benchmark	Category	Score	Metric	Status	Date
SWE-bench Pro	Coding	59.0%	% resolved	Verified	Jun 15, 2026	Details
Terminal-Bench 2.1	Agents	80.2%	task success	Verified	Jun 15, 2026	Details
Humanity's Last Exam	Reasoning	47.2%	accuracy	Verified	Jun 15, 2026	Details
GPQA Diamond	Reasoning	95.5%	accuracy	Verified	Jun 15, 2026	Details
CharXiv	Multimodal	85.1%	accuracy	Verified	Jun 15, 2026	Details
SciCode	Coding	60.1%	accuracy	Verified	Jun 15, 2026	Details
LiveCodeBench	Coding	92.9%	Pass@1	Verified	Jun 15, 2026	Details