Compare models on selected benchmarks

Models

1 selected

DeepSeek V4 FlashDeepSeek

Benchmarks

3 selected

SWE-bench VerifiedCodingDeepSWECodingSWE-bench ProCoding

Benchmark	DeepSeek V4 FlashOpenDeepSeek
SWE-bench Verified% resolved	79.0%
DeepSWE% resolved	—
SWE-bench Pro% resolved	52.6%

% resolved

79.0%

% resolved

—

% resolved

52.6%

No aggregate score is calculated. Each row uses its benchmark’s own metric. Compare rows independently.