PUMA Vault

Etiqueta: swe-bench

18 artículos con esta etiqueta.

15 jun 2026
MASAI: Modular Architecture for Software-Engineering AI Agents
15 jun 2026
SWE-bench: Can Language Models Resolve Real-World GitHub Issues?
15 jun 2026
MAGIS: LLM-Based Multi-Agent Framework for GitHub Issue Resolution
15 jun 2026
OpenHands: An Open Platform for AI Software Developers as Generalist Agents
15 jun 2026
AI Agent Specialization. RAG vs Fine-tuning — T3chFest 2026
15 jun 2026
📦 Repository Notes — Analysed Reference Code & Architectural Patterns
15 jun 2026
📦 Repository Gist — Analysed Reference Gist
15 jun 2026
📊 Tools — Datasets, Benchmarks & Data Access
15 jun 2026
Multi-agent systems outperform single agents on PM tasks when agent roles match task specialisation boundaries
15 jun 2026
Research Rabbit — Seed Expansion for PUMA Corpus
15 jun 2026
Connected Papers — Citation Map for PUMA
15 jun 2026
📖 Glossary Supplement v2 — Extended Technical Terms
15 jun 2026
📚 Bibliography: Spec-Driven Development (SDD) and Agentic Software Engineering
15 jun 2026
📚 Bibliography Supplement v3 — Verified New References
15 jun 2026
📊 MOC — LLM Benchmarks, PM-AI Convergence & Agent Architectures (v2)
15 jun 2026
🔧 MOC — PUMA Full Technology Stack
01 mar 2026
Chapter 2 — Literature Review (State of the Art)
01 mar 2026
📖 MOC — Literature Review (SLR)

Creado con Quartz v4.5.2 © 2026

GitHub
Discord Community