Einführung
Der aktuelle KI-Markt boomt, insbesondere im generativen KI-Universum, mit der Einführung von OpenAIs ChatGPT-4 im Jahr 2023 und Claude 3 von Anthropic AI Anfang dieses Monats. Diese Modelle erleichtern die Arbeit von Content-Entwicklern, und jetzt gibt es einen Softwareentwickler in der Stadt.
Vor weniger als 72 Stunden hat Cognition Devin veröffentlicht , den weltweit ersten vollständig autonomen KI-Softwareentwickler, der einen neuen Standard für den SWE-Bench-Codierungs-Benchmark setzt. Mit nur einer einzigen Eingabeaufforderung kann Devin Code schreiben oder Websites erstellen, ganz wie ein menschlicher Softwareentwickler.
Bevor wir uns etwas tiefer mit Devin befassen, machen wir uns mit seinem Schöpfer vertraut – Cognition.
Was ist Kognition?
Cognition wurde im November 2023 gegründet und ist ein in den USA ansässiges Labor für angewandte KI , das sich auf logisches Denken konzentriert. Durch die Nutzung des logischen Denkens wollen sie eine Vielzahl von Disziplinen der künstlichen Intelligenz erschließen. Cognition besteht derzeit aus Fachleuten und Führungskräften, die mit Technologiegiganten wie Google DeepMind, Cursor, Scale AI und Nuro zusammengearbeitet haben. Sie haben bereits 21 Millionen US-Dollar gesichert , angeführt von Peter Thiels Founders Fund. Cognition wird von Giganten wie Tony Xu, CEO von DoorDash, und Fred Ehrsam, Gründer von Coinbase, einer Krypto-Plattform, unterstützt.
Was ist Devin?
Devin ist ein autonomes Modell, das komplexe Code- und Softwareentwicklungsaufgaben mit einer einzigen Eingabeaufforderung planen, analysieren und ausführen kann. Es verfügt über eine eigene Befehlszeile, einen Code-Editor und einen separaten Webbrowser.
Die Fähigkeiten des Modells wurden demonstriert, indem Metas Llama 2 mit einigen verschiedenen API-Anbietern getestet wurde. Devin erstellte zunächst einen schrittweisen „Plan“, bevor er sich dem Problem widmete. Anschließend erstellte er das gesamte Projekt mit denselben Tools, die ein menschlicher Softwareentwickler verwenden würde. Über den integrierten Browser konnte Devin die API-Dokumentation aufrufen, um sich einzulesen und zu lernen, wie man sich in jede dieser APIs einklinkt. Schließlich erstellte und stellte er eine Website mit vollständigem Styling bereit.
Was Devin auszeichnet, ist seine Fähigkeit, aus Fehlern zu lernen. Es kann Tausende von Entscheidungen treffen und wird mit der Zeit besser.
Es schnitt besser ab als andere Lösungen, als es anhand einiger Standardprobleme der Softwareentwicklung getestet wurde.
Devin hat sich außerdem bei führenden Technologiemarken zu KI-Aufgaben beworben und die Erwartungen erfüllt. Außerdem hat er Aufgaben aus echten Jobs erledigt, die auf Upwork ausgeschrieben waren, wie etwa Codierungsaufgaben, das Debuggen von Computer-Vision-Modellen und das Erstellen detaillierter Berichte.
Einen Blick auf Devin konnte man mit GitHub Copilot werfen, einem Tool zur Codevervollständigung. Programmierer können Eingabeaufforderungen in ausführbaren Code umwandeln. Dieser KI-Programmierer kann nicht nur Codeblöcke vervollständigen, sondern sie auch in mehrere Sprachen übersetzen. Ziemlich beeindruckend, oder? Aber Devin geht noch einen Schritt weiter, indem er Codes von Grund auf ohne menschliches Eingreifen fertigstellen kann.
Wie funktioniert Devin?
Wie bereits erwähnt, verfügt Devin über eine eigene Befehlszeile, einen eigenen Code-Prompter-Bereich und einen eigenen Webbrowser zum Sammeln der Ressourcen.
Wenn eine Eingabeaufforderung eingegeben wird, wechselt Devin in den „Planer“-Modus, wo eine Schritt-für-Schritt-Anleitung erklärt, wie das Problem zu lösen ist.
Sobald dies erledigt ist, wechselt das Dashboard zu einer vierteiligen Oberfläche
- eine, die alle Eingabeaufforderungen enthält
- zweitens der Befehlszeilenabschnitt
- drittens einen eigenen Code-Editor und
- viertens verfügt es über einen eigenen Browser, der Ressourcen gründlich analysiert, um Rückschlüsse abzuleiten.
- Abschließend gibt es eine Visualisierung der Lösung.
Wie erhalte ich Zugriff auf Devin?
Devin ist für den Frühzugriff verfügbar und man kann Devin nutzen oder „mieten“, indem man sich auf die Warteliste setzt .
Wie schlägt sich Devin im Vergleich zu anderen Models?
Devin wurde auf SWE-bench getestet, einer Benchmarking-Plattform, die Agenten mit der Lösung realer Probleme bei Open-Source-Projekten beauftragt und am häufigsten von Softwareentwicklern verwendet wird. Laut Cognition wurde Devin anhand einer zufälligen Teilmenge von 25 % des Datensatzes bewertet. Alle Modelle wurden unterstützt, d. h. den Modellen wurden die genauen Dateien mitgeteilt, die bearbeitet werden mussten, während Devin keine Unterstützung erhielt. Devin löste 13,86 % der Probleme von Anfang bis Ende korrekt, was ein enormer Sprung gegenüber den 4,8 % von Claude 2 und den 1,74 % von ChatGPT-4 ist . Cognition gab an, dass sie bald einen detaillierteren technischen Bericht veröffentlichen werden!
Wird Devin einen Softwareentwickler ersetzen?
Die beeindruckenden Zahlen aus dem Benchmarking haben bei den Menschen, insbesondere bei Softwareentwicklern und Ingenieuren, für Unruhe hinsichtlich der Zukunft von Softwarejobs und verwandten Berufen gesorgt.
Cognition, ein auf logisches Denken spezialisiertes Labor für angewandte KI, behauptet, KI-Teamkollegen aufzubauen, deren Fähigkeiten über die vorhandener KI-Tools hinausgehen.
Cognition erklärt: „ Devin ist ein unermüdlicher, erfahrener Teamkollege, der gleichermaßen bereit ist, mit Ihnen zusammenzuarbeiten oder Aufgaben selbstständig zu erledigen, die Sie dann überprüfen. Mit Devin können sich Ingenieure auf interessantere Probleme konzentrieren und Ingenieurteams können nach ehrgeizigeren Zielen streben . “
Interessanterweise stellen Cognition, die Entwickler von Devins, gerade aktiv „menschliche“ Softwareentwickler ein, während die meisten davon ausgehen, dass Devins das Ende vieler Softwareentwickler ist! Die Meinungen gehen auseinander, und bis Devins vollständig getestet wurde, können wir zu keinen Schlussfolgerungen kommen.
Andrej Karpathy, der ehemalige KI-Direktor von Tesla, zitiert: „Meiner Meinung nach wird die Automatisierung der Softwareentwicklung der Automatisierung des Autofahrens ähneln.“ Er sagt weiter, dass die Softwareentwicklung auf dem Weg zu einem grundlegenden Wandel sei. Sie würde eine viel stärker überwachte Automatisierung beinhalten, während hochrangige Befehle, Ideen oder Fortschrittsstrategien auf Englisch eingebracht würden.
Wie jedes andere generative KI-Tool kann Devins nur so gut sein wie die Person, die es verwendet! Dies sind nur Werkzeuge in den Händen eines effizienten Benutzers, die seine Aufgaben viel weniger mühsam und zeitaufwändig machen!
Mehr lesen: Wazuh: Einführung und Installation
Fazit
Devin AI ist ein großer Fortschritt im Bereich der generativen KI und revolutioniert den Bereich der Softwareentwicklung durch die Automatisierung von Codierungsaufgaben und komplexen Problemen. Mit Modellen wie GPT-4, Claude 3 und jetzt Devin sieht die Zukunft der generativen KI vielversprechend aus; sie sind nicht hier, um uns zu ersetzen, sondern um uns zu unterstützen. Wir sehen uns im nächsten!