Der generative KI-Chatbot ChatGPT von OpenAI ist laut Forschern der Purdue University nur bedingt als Antwortgeber für Programmierfragen geeignet. Bei der Erstellung von Code-Fragmenten für Software-Vorhaben lieferte das Tool in Tests nur bedingt hilfreiche Ergebnisse – insbesondere bei Stack Overflow.
Ernüchternde Testergebnisse
Die Ergebnisse der Testreihe sind ernüchterd, denn der Chatbot hat mit 48 Prozent noch nicht einmal die Hälfte der gestellten Fragen korrekt beantwortet. Zudem fielen 78 Prozent der Antworten im Vergleich zu menschlichen Antworten auf verschiedenen Ebenen inkonsistent aus – dennoch formaler, analytischer und in weniger negativer Tonalität.
Bedingt dadurch konnten 39 Prozent der Fragestellenden dadurch überzeugt werden. Allerdingt gibt es nur bei 22 Prozent Übereinstimmungen zu den von Menschen gegebenen Antworten. Einen Pluspunkt kassiert ChatGPT allerdings in Sachen Verständlichkeit, wie es heißt. Der Bot sei zu 65 Prozent verständlich und die Antworten gut lesbar. Ein Problem bleibt nach wie vor die Fülle an gelieferten irrelevanten Infos.
www.pressetext.com