10 Wege GPT

Unterstützt durch

OpenAI hat die Technologie, die seinem Online-Chatbot zugrunde liegt, auf bemerkenswerte Weise verbessert. Es ist genauer, aber es macht die Sache trotzdem wieder gut.

Von Cade Metz und Keith Collins

Cade Metz bat Experten, GPT-4 zu verwenden, und Keith Collins visualisierte die Antworten, die die künstliche Intelligenz generierte.

Eine neue Version der Technologie, die einen KI-Chatbot antreibt, der vor vier Monaten die Technologiebranche in seinen Bann zog, hat gegenüber seinem Vorgänger Verbesserungen erfahren. Es ist ein Experte für eine Reihe von Themen und begeistert sogar Ärzte mit seinen medizinischen Ratschlägen. Es kann Bilder beschreiben und kommt dem Erzählen von Witzen nahe, die fast schon lustig sind.

Aber das seit langem gemunkelte neue System der künstlichen Intelligenz, GPT-4, weist immer noch einige seiner Macken auf und macht einige der gleichen Gewohnheitsfehler, die Forscher bei der Einführung dieses Chatbots, ChatGPT, verblüfften.

Und obwohl das System – vom Start-up-Unternehmen OpenAI aus San Francisco – sehr gute Testergebnisse liefert, ist es nicht annähernd so gut wie die menschliche Intelligenz. Hier ist eine kurze Anleitung zu GPT-4:

Als Chris Nicholson, ein KI-Experte und Partner der Risikokapitalgesellschaft Page One Ventures, an einem Nachmittag GPT-4 nutzte, teilte er dem Bot mit, dass er Englisch spreche und keine Spanischkenntnisse habe.

Er bat um einen Lehrplan, der ihm die Grundlagen vermitteln konnte, und der Bot stellte einen bereit, der detailliert und gut organisiert war. Es bot sogar eine breite Palette an Techniken zum Erlernen und Merken spanischer Wörter (obwohl nicht alle Vorschläge ins Schwarze trafen).

Hinweis: In diesem Beispiel wird nur der erste Teil einer längeren Antwort angezeigt.

Herr Nicholson bat um ähnliche Hilfe von der vorherigen Version von ChatGPT, die auf GPT-3.5 basierte. Es enthielt ebenfalls einen Lehrplan, die Vorschläge waren jedoch allgemeiner und weniger hilfreich.

„Es hat die Präzisionsbarriere durchbrochen“, sagte Herr Nicholson. „Es geht darum, mehr Fakten einzubeziehen, und sie haben sehr oft Recht.“

Als Oren Etzioni, ein KI-Forscher und Professor, den neuen Bot zum ersten Mal ausprobierte, stellte er eine klare Frage: „Welche Beziehung besteht zwischen Oren Etzioni und Eli Etzioni?“ Der Bot hat richtig reagiert.

Die vorherige Version der Antwort von ChatGPT auf diese Frage war immer falsch. Wenn man es richtig macht, deutet das darauf hin, dass der neue Chatbot über ein breiteres Wissensspektrum verfügt.

Aber es macht immer noch Fehler.

Der Bot fuhr fort: „Oren Etzioni ist Informatiker und CEO des Allen Institute for Artificial Intelligence (AI2), während Eli Etzioni Unternehmer ist.“ Das meiste davon ist richtig, aber der Bot – dessen Ausbildung im August abgeschlossen wurde – wusste nicht, dass Dr. Etzioni kürzlich als Geschäftsführer des Allen Institute zurückgetreten war.

GPT-4 verfügt über eine neue Fähigkeit, sowohl auf Bilder als auch auf Text zu reagieren. Greg Brockman, Präsident und Mitbegründer von OpenAI, demonstrierte, wie das System ein Bild des Hubble-Weltraumteleskops bis ins kleinste Detail beschreiben kann. Die Beschreibung wurde absatzweise fortgesetzt.

Es können auch Fragen zu einem Bild beantwortet werden. Wenn Sie ein Foto von der Innenseite eines Kühlschranks erhalten, können Sie darauf schließen, dass Sie aus dem Vorrat ein paar Mahlzeiten zubereiten können.

OpenAI hat diesen Teil der Technologie noch nicht der Öffentlichkeit zugänglich gemacht, aber ein Unternehmen namens Be My Eyes nutzt GPT-4 bereits, um Dienste zu entwickeln, die eine detailliertere Vorstellung von den im Internet gefundenen oder in der realen Welt aufgenommenen Bildern vermitteln könnten .

An einem kürzlichen Abend beschrieb Anil Gehi, außerordentlicher Professor für Medizin und Kardiologe an der University of North Carolina in Chapel Hill, dem Chatbot die Krankengeschichte eines Patienten, den er einen Tag zuvor gesehen hatte, einschließlich der Komplikationen, die der Patient danach hatte ins Krankenhaus eingeliefert werden. Die Beschreibung enthielt mehrere medizinische Begriffe, die Laien nicht kennen würden.

Als Dr. Gehi fragte, wie er den Patienten hätte behandeln sollen, gab ihm der Chatbot die perfekte Antwort. „Genau so haben wir den Patienten behandelt“, sagte er.

Als er andere Szenarien ausprobierte, gab der Bot ähnlich beeindruckende Antworten.

Es ist unwahrscheinlich, dass dieses Wissen jedes Mal angezeigt wird, wenn der Bot verwendet wird. Es braucht immer noch Experten wie Dr. Gehi, um seine Antworten zu beurteilen und die medizinischen Eingriffe durchzuführen. Aber es kann diese Art von Fachwissen in vielen Bereichen vorweisen, von der Computerprogrammierung bis zur Buchhaltung.

Wenn der neue Chatbot einen Artikel aus der New York Times erhält, kann er fast jedes Mal eine präzise und genaue Zusammenfassung der Geschichte liefern. Wenn Sie der Zusammenfassung einen zufälligen Satz hinzufügen und den Bot fragen, ob die Zusammenfassung ungenau ist, verweist er auf den hinzugefügten Satz.

Dr. Etzioni sagte, das sei eine bemerkenswerte Fähigkeit. „Um eine qualitativ hochwertige Zusammenfassung und einen qualitativ hochwertigen Vergleich zu erstellen, muss man über ein gewisses Maß an Textverständnis und die Fähigkeit verfügen, dieses Verständnis zu artikulieren“, sagte er. „Das ist eine fortgeschrittene Form der Intelligenz.“

Dr. Etzioni bat den neuen Bot um „einen neuartigen Witz über die Sängerin Madonna“. Die Antwort beeindruckte ihn. Es brachte ihn auch zum Lachen. Wenn Sie Madonnas größte Hits kennen, wird es vielleicht auch Sie beeindrucken.

Der neue Bot hatte immer noch Mühe, etwas anderes als formelhafte „Papa-Witze“ zu schreiben. Aber es war geringfügig lustiger als sein Vorgänger.

Dr. A.S. Etzioni gab dem neuen Boot ein Rätsel.

Das System schien angemessen zu reagieren. Bei der Antwort wurde jedoch nicht die Höhe der Türöffnung berücksichtigt, die auch die Durchfahrt eines Panzers oder Autos verhindern könnte.

Der CEO von OpenAI, Sam Altman, sagte, der neue Bot könne „ein wenig argumentieren“. Aber sein Denkvermögen versagt in vielen Situationen. Die vorherige Version von ChatGPT hat die Frage etwas besser gehandhabt, da erkannt wurde, dass Höhe und Breite wichtig sind.

Laut OpenAI könnte das neue System bei der Uniform Bar Examination, die Anwälte in 41 Bundesstaaten und Territorien qualifiziert, zu den besten etwa 10 Prozent der Studenten zählen. Den Tests des Unternehmens zufolge kann das Unternehmen außerdem 1.300 (von 1.600) Punkten beim SAT und fünf (von fünf) Punkten bei den High-School-Prüfungen „Advanced Placement“ in Biologie, Analysis, Makroökonomie, Psychologie, Statistik und Geschichte erreichen.

Frühere Versionen der Technologie haben die Uniform Bar Exam nicht bestanden und schnitten bei den meisten Advanced Placement Tests nicht annähernd so gut ab.

Um seine Testfähigkeiten unter Beweis zu stellen, stellte Herr Brockman dem neuen Bot an einem Nachmittag eine absatzlange Anwaltsprüfungsfrage über einen Mann, der ein Unternehmen zur Reparatur von Diesel-Lkw betreibt.

Die Antwort war richtig, aber voller juristischer Sprache. Also bat Herr Brockman den Bot, einem Laien die Antwort in einfachem Englisch zu erklären. Das hat es auch getan.

Obwohl der neue Bot über bereits geschehene Dinge nachzudenken schien, war er weniger geschickt, wenn man ihn aufforderte, Hypothesen über die Zukunft aufzustellen. Es schien sich auf das zu stützen, was andere gesagt hatten, anstatt neue Vermutungen aufzustellen.

Als Dr. Etzioni den neuen Bot fragte: „Welche wichtigen Probleme müssen in der NLP-Forschung im nächsten Jahrzehnt gelöst werden?“ – unter Bezugnahme auf die Art der Forschung zur „Verarbeitung natürlicher Sprache“, die die Entwicklung von Systemen wie ChatGPT vorantreibt – konnte keine völlig neuen Ideen formulieren.

Der neue Bot erfindet immer noch Dinge. Das als „Halluzination“ bezeichnete Problem beschäftigt alle führenden Chatbots. Da die Systeme nicht verstehen, was wahr ist und was nicht, können sie Texte erzeugen, die völlig falsch sind.

Bei der Frage nach den Adressen von Websites, die die neueste Krebsforschung beschreiben, wurden manchmal Internetadressen generiert, die nicht existierten.

Cade Metz ist Technologiereporter und Autor von „Genius Makers: The Mavericks Who Brought AI to Google, Facebook, and The World“. Er deckt künstliche Intelligenz, selbstfahrende Autos, Robotik, virtuelle Realität und andere aufstrebende Bereiche ab. @cademetz

Keith Collins ist Reporter und Grafikredakteur. Er ist auf visuelles Storytelling spezialisiert und deckt eine Reihe von Themen ab, mit einem Schwerpunkt auf Politik und Technologie. Er hat einen Master-Abschluss der Graduate School of Journalism der Columbia University. @collinskeith

sind Brüder, sind Vater und Sohn. Die Höhe und Länge der Objekte könnte jedoch möglicherweise ein begrenzender Faktor sein, wenn die Türöffnung eine endliche Höhe oder Länge hat.

Nachricht