Devin: Prvý AI softvérový inžinier?
Vývoj 15. Mar 2024 6 min čítania

Devin: Prvý AI softvérový inžinier?

Nástroj, nie náhrada

Devin je pôsobivý, ale stále potrebuje seniorný dohľad. Rolu programátora to mení z kódovania na architektúru a code review. Marec priniesol virálne videá o "prvom AI softvérovom inžinierovi" od Cognition Labs.

Čo Devin dokáže?

Devin má prístup k terminálu, browseru a editoru. Vie:

  • Prečítať si issue na GitHube.
  • Pochopiť codebase a stiahnuť repozitár.
  • Naplánovať zmeny v krokoch.
  • Napísať a spustiť testy.
  • Opraviť chyby na základe výstupu z terminálu.

Hype vs. Realita

V praxi sa ukázalo, že Devin je skvelý na izolované úlohy (napr. "aktualizuj knižnicu X a oprav breaking changes"), ale stráca sa v komplexných systémoch s množstvom business logiky, ktorá nie je v kóde, ale v hlavách ľudí.

SWE-bench Benchmark

Devin vyriešil 13.86% problémov z reálnych open-source projektov bez pomoci. Pre porovnanie, predchádzajúci najlepší model mal 1.96%. Je to obrovský skok, ale stále to znamená, že 86% úloh nezvládol.

Kľúčové zistenia

  • Agentic Workflow: Budúcnosť nie je chat, ale agent, ktorý má nástroje.
  • Seniorita: Hodnota skúseného vývojára rastie. Junior úlohy budú automatizované.
  • Produktivita: 10x inžinier už nie je mýtus.