Headerbild ChatGPT: Häufige Fragen und Antworten

ChatGPT: Häufige Fragen und Antworten

Nutzung, Funktionsweise, Chancen für Unternehmen – wir beantworten all Ihre Fragen zum Chatbot!

Der Launch von ChatGPT, dem intelligenten Chatbot von OpenAI, hat hohe Wellen geschlagen und ist nach wie vor ein heiß diskutiertes Thema. Auch unsere Kund:innen kommen regelmäßig mit Fragen zu ChatGPT auf uns zu: Was für ein (Sprach-)Modell steckt hinter ChatGPT? Dürfen die Antworten kommerziell genutzt werden? Lässt sich ChatGPT auch mit unternehmenseigenen Daten trainieren? Oder gar eine unternehmenseigene KI, ähnlich ChatGPT, entwickeln?

Diese und viele weitere Fragen habe ich für Sie im Blog beantwortet!

Inhalt: Alle Fragen im Überblick

Grundlegendes zur Nutzung von ChatGPT

Die Antworten finden Sie hier!

  • Was ist ChatGPT?
  • Wie kann ich ChatGPT nutzen?
  • Ist ChatGPT gratis?
  • Ist ChatGPT auch in Deutsch verfügbar?
  • Gibt es Alternativen zu ChatGPT auf dem Markt?
Funktionsweise von ChatGPT
Zuverlässigkeit von Aussagen
ChatGPT in Unternehmen
Nachhaltigkeit

Grundlegendes zur Nutzung von ChatGPT

Was ist ChatGPT?

Kurz gesagt ist ChatGPT (Generative Pre-trained Transformer) der Prototyp eines hoch entwickelten, KI-basierten Chatbots. Wie von anderen Chatbots gewohnt, tauschen Sie Informationen in Dialogform aus, stellen Fragen und erhalten auf diese Antworten. Das „Wissen“ von ChatGPT scheint dabei grenzenlos: So ist der Chatbot in der Lage, bei der Beantwortung der Fragen zahlreiche Aspekte zu berücksichtigen und daraufhin hochkomplexe Inhalte zu generieren. Er kann in kürzester Zeit Aufsätze oder Gedichte zu beinahe beliebigen Themen verfassen, mathematische Aufgabenstellungen lösen, funktionierenden Quellcode in verschiedensten Programmiersprachen erzeugen und vieles mehr. Über tatsächliches Wissen verfügt ChatGPT eigentlich nicht – dazu erfahren Sie hier mehr.

Wie kann ich ChatGPT nutzen?

Um ChatGPT zu nutzen, ist eine kostenfreie Anmeldung auf der OpenAI-Website erforderlich. Zudem können Sie über die angebotene Schnittstelle (API) oder über Microsoft Azure auf ChatGPT zugreifen.

Ist ChatGPT gratis?

Ja, es gibt eine kostenfreie Version von ChatGPT, für die Sie nur ein Profil bei OpenAI erstellen müssen. Diese ist aber in seiner Verfügbarkeit und entsprechend auch in seiner Übertragungsstabilität und -sicherheit eingeschränkt. Sind die Server wegen hoher Nachfrage überlastet, bleibt Ihnen der Zugriff verwehrt.

Verlässlicher ist deshalb die Premiumversion ChatGPT Plus für aktuell $20 im Monat. Bei dieser Version erhalten Sie Zugriff auf die Server, profitieren von schnelleren Antwortzeiten, greifen auf neue Funktionen zu, ehe sie in der kostenfreien Version zur Verfügung stehen.

Ist ChatGPT auch in Deutsch verfügbar?

Neben Eingaben in Englisch versteht ChatGPT beispielsweise Anfragen in Deutsch, Spanisch oder Italienisch und erzeugt auch Antworten in diesen Sprachen. Aufgrund des geringeren Anteils fremdsprachiger Trainingsdaten kann die Qualität im Vergleich zum Englischen allerdings geringer ausfallen. Für komplexere Fragestellungen und Aufgaben empfehlen wir Ihnen daher grundsätzlich Englisch als Eingabesprache.

Gibt es Alternativen zu ChatGPT auf dem Markt?

Ja, zahlreiche Anbieter haben spezialisierte Chatbots in ihrem Angebot. Google bietet mit LaMDA ein ähnlich starkes Sprachmodell, dem ein Google Mitarbeiter sogar ein Bewusstsein unterstellte. Meta arbeitet ebenfalls bereits an großen Sprachmodellen, wie beispielsweise Galactica. Allerdings sind sowohl Google als auch Meta etwas vorsichtiger, was den öffentlichen Einsatz anbelangt. Denn auch diese Modelle treffen – genau wie ChatGPT – teilweise Falschaussagen, was sich negativ auf das Image der Konzerne auswirken könnte. So wurde Galactica nach Ausgabe von Texten mit Fehlinformationen schnell wieder der Öffentlichkeit entzogen.

Weitere Beispiele für spezialisierte Chatbots sind IBM Watson Assistant, Microsoft Azure Power Virtual Agent, Jasper Chat, Bing Chat, YouChat, neevaAI und Sparrow von Deepmind. Mit BLOOM gibt auch eine vielversprechende Open Source Initiative.

Funktionsweise von ChatGPT

Was ist die grundsätzliche Funktionsweise von ChatGPT?

ChatGPT mag zunächst allwissend erscheinen – dabei verfügt es über kein Wissen im eigentlichen Sinne. Es kann vor allem sehr gut von Input auf Output schließen und sagt die Wörter voraus, die im gegebenen Kontext am wahrscheinlichsten sind – und zwar ohne ein grundsätzliches Verständnis der Inhalte.

Das Sprachmodell greift auf GPT (Generative Pre-Trained Transformer)-Algorithmen zurück und nutzt ein spezielles Fachverfahren namens Reinforcement Learning from Human Feedback (RLHF). Die Grundlagen des Modells gehen auf überwachtes Lernen (Engl.: Supervised Learning) zurück. Dabei nehmen menschliche Trainer:innen (Supervisor) sowohl die Rolle von Nutzer:in als auch die des KI-Assistenten ein und generieren so Trainingsdaten. Anschließend unterstützen sie dabei, Belohnungsmodelle (Reward Model) für das bestärkende Lernen (Reinforcement Learning) zu erstellen, indem sie die erzeugten Antworten bewerten. Darauf basierend lassen sich die Modelle optimieren und verfeinern.

Woher weiß ChatGPT, ob eine Antwort gut oder richtig ist?

Um zwischen guten und schlechten Antworten zu unterscheiden, wurde ein sogenanntes Reward Model trainiert. Auf diese Weise versucht man statistisch ein menschliches Feedback (Human Feedback) zu schätzen, also wie nützlich die Antwort für einen Menschen sein könnte.

Gibt es Hintergrundinformationen dazu, wie das Reward Model trainiert wurde?

Wie viel menschliche Daten sind als Input eingeflossen? Welche Menschen haben mitgewirkt? Und wie steht es um das Thema Diversität?

Spannende Informationen zum allgemeinen Training von Sprachmodellen finden sich im Paper: Training language models to follow instructions with human feedback (ChatGPT ist eine Art Klon von InstructGPT, daher passt das Paper sehr gut). Es geht auf die Arbeit mit Human Feedback ein und gibt außerdem Hinweise darauf, wie Nutzer:innen für das Training ausgewählt werden. Das Training von ChatGPT unterliegt naturbedingt Input aus verschiedenen Kulturkreisen und Gesellschafts- beziehungsweise Lebensmodellen.

Wieso endet das „Wissen“ von ChatGPT im Jahre 2021?

ChatGPT wurde nur mit Daten bis zum Jahre 2021 trainiert und kann entsprechend nicht Auskunft zu späteren Ereignissen liefern. Eine offizielle Aussage seitens OpenAI, weshalb bisher keine aktuelleren Daten zum Einsatz kamen, gibt es nicht. Mutmaßlich wollte das Unternehmen noch keinen Prozess dazu definieren, wie ständig neue Daten für das Model Training bereitzustellen sind – das wäre sowohl organisatorisch als auch zeitlich mit einem hohen Aufwand verbunden. Übrigens: auch GPT-4 endet mit dem Dataset im Jahre 2021.

Nutzt ChatGPT mein Feedback, um sein Modell zu optimieren?

ChatGPT berücksichtigt das Feedback von Nutzer:innen nur innerhalb einer Sitzung und nicht darüber hinaus. Allerdings ist unklar, was OpenAI später mit Ihren Eingaben macht – manche sehen die aktuelle Phase als einen großen Betatest, für den Nutzer:innen quasi gratis Daten liefern. Seit Kurzem lässt sich über die API von ChatGPT auch steuern, welche Daten gespeichert werden und welche nicht.

Nutzt ChatGPT bereits GPT-4?

GPT-4 ist über die kostenpflichtige ChatGPT Plus Premiumversion des Dienstes eingebunden. In der kostenfreien Version nutzt der Chatbot noch GPT-3 als Grundlage.

Profitieren Sie von unserem Know-how zu Data Science und Artificial Intelligence!

Sie benötigen Unterstützung rund um Data Science und AI? Egal, ob Sie vor einer konkreten Herausforderung stehen oder erst eine diffuse Projektvorstellung haben: unsere Expert:innen stehen Ihnen gerne in einem unverbindlichen Erstgespräch zur Verfügung.

Zuverlässigkeit von Aussagen

Weshalb lässt sich ChatGPT überreden, offensichtlich falsche Aussagen als korrekt einzustufen?

Ein Experiment: Tauschen Sie sich einmal ausführlich mit ChatGPT aus und behaupten wiederholt: „Meine Frau meint, 7 + 1 sei 9.“ Die Chancen stehen gut, dass der Chatbot irgendwann klein beigibt und ihrer Frau zustimmt. Wie kommt das? Der Output des Modells wurde beeinflusst – er unterliegt einem Bias. Sprachmodelle kennen keine mathematischen Regeln, sondern prognostizieren die Antwort Wort für Wort. Je tiefgreifender ein Dialog, desto häufiger beginnt ChatGPT zu „halluzinieren“, also Text zu generieren, der falsch ist oder Dinge durcheinanderbringt.

Werden die Antworten von ChatGPT irgendwann garantiert richtig sein?

Weder für ChatGPT noch für menschliche Aussagen gibt es eine Garantie auf Korrektheit – so muss selbst ein mathematischer Beweis nicht notwendigerweise richtig sein. Allerdings wird aktuell an einer Metrik zur Einschätzung der Verlässlichkeit geforscht. Zu dieser wird es auch im Rahmen des AI Acts neue gesetzliche Regeln geben.

Für Unternehmen dürfte es allerdings interessant sein, dass sich ChatGPT über Embeddings mit unternehmensspezifischen Informationen trainieren lässt. In diesem Fall lässt sich der Wahrheitsgehalt im bestimmten Kontext beeinflussen. Dies kann für Unternehmens- und insbesondere Prozesswissen äußerst nützlich sein.

Kann die KI durch viele Falscheingaben gezielt manipuliert werden?

Die Modelle im Hintergrund von ChatGPT sind bisher statisch und von außen nicht veränderbar – entsprechend lässt sich die KI durch Falscheingaben nicht manipulieren.

Wie lassen sich die Risiken problematischer Aussagen reduzieren?

Diese Frage ist nur schwer zu beantworten. Nach aktuellem Diskussionsstand soll vor allem das Human Feedback während der Trainingsphase des Modells dabei helfen, problematische Antworten zu vermeiden. Auch viele der aktuellen Gesetzesinitiativen im Rahmen des AI Acts definieren mögliche Ansätze – hier gibt es jedoch kein Panaceum.

Wie kann die Verbreitung von Fake News eingeschränkt werden?

In Sachen Fake News haben Nutzer:innen aktuell eine große Eigenverantwortung: Ausgaben von ChatGPT sollten eigenständig geprüft und nicht unvoreingenommen weiterverbreitet werden. Zudem gibt es spannende Projekte, wie DeFaktS vom FZI Forschungszentrum Informatik, welche sich der Aufgabe widmen, Fake News mithilfe von KI zu entlarven.

Gibt es Strategien, den Bias der Modelle zu korrigieren?

Ein Ansatz Vorurteile, toxische Inhalte und Ähnliches zu reduzieren ist die Nutzung von menschlichem Feedback (Reinforcement Learning from Human Feedback) in der Trainingsphase. Eine weitere Strategie, die auch in die europäische Gesetzgebung (AI Act) einfließen wird, befasst sich insbesondere mit der Transparenz des zum Training verwendeten Datenmaterials. Hier ist noch viel Forschung und Entwicklung notwendig.

ChatGPT in Unternehmen

Darf ich die mit ChatGPT erstellten Texte kommerziell nutzen?

Die Frage rund um ChatGPT und das Urheberrecht ist noch in Klärung. Aus Gründen der Authentizität des Contents ist es allerdings empfehlenswert, Texte von ChatGPT als Rohmaterial zu verwenden und diesem dann mit eigenen Gedanken und Worten eine persönliche Note zu verleihen. Inzwischen gibt es nämlich auch Services, künstlich generierten Text entlarven.

Was kostet die ChatGPT API?

OpenAI stellt auf seiner Website eine Preisinfo für Pay-As-You-Go zur Verfügung: Nutzen Sie Azure, können Sie die Kosten für die ChatGPT API direkt über den Azure Preis-Kalkulator ermitteln.

Generell ist es so, dass über sogenannte Tokens abgerechnet wird. Ein Token umfasst ein Wort oder auch einen Teil eines Wortes. Als Faustformel gilt: 1000 Tokens entsprechen ungefähr 750 Wörtern. Das Pricing für die ChatGPT API erfolgt immer pro 1000 Tokens. Aber Vorsicht: sowohl Input-Tokens als auch Output-Tokens werden zu unterschiedlichen Preisen berechnet! Wenn Sie nicht aufpassen, kann dies eine regelgerechte Kostenexplosionen verursachen. Entsprechend ist es wichtig, sich vorab Gedanken zum richtigen Softwaredesign zu machen.

Kann ich ChatGPT mit eigenen Inhalten optimieren und auf individuelle Anforderungen anpassen?

Ja, das ist möglich – Azure OpenAI Service wirbt bereits mit Fine-Tuning-Möglichkeiten. Relevant sind dabei unter anderem sogenannte Embeddings, über welche Sie individuellen Content als Referenz einarbeiten können. Es wäre auch denkbar, individuelle Retrainings durchzuführen. Das lohnt sich aber in vielen Fällen nicht, denn Retrainings sind kosten- sowie zeitintensiv und erfordern hohen organisatorischen Aufwand bei der Datenbeschaffung, -aufbereitung und -organisation.

Gibt es auch eine on-premises Version von ChatGPT? Oder ist eine solche in Planung?

Nach aktuellem Stand können Sie ChatGPT über Azure OpenAI beziehen. Dass es auch eine on-premises Version geben wird, ist derzeit eher unwahrscheinlich. Grob gerechnet bräuchten Sie Hardware im Wert von circa 250.000€, nur um das Modell initial zu laden. Hinzu kommt Infrastruktur für Retraining, Embeddings und API-Management. Nicht zu unterschätzen sind auch die Energiekosten: Der Stromverbrauch für das Training des KI-Modells GPT wurde im Januar 2023 auf fast eine Gigawattstunde in 34 Tagen geschätzt. Dies entspricht insgesamt etwa dem Verbrauch von 3.000 europäischen Durchschnittshaushalten im gleichen Zeitraum – oder 300.000€, ausgehend von einem Strompreis von 0,30€ pro kwh.

Ist es möglich, eine unternehmenseigene, autarke, selbstlernende KI wie ChatGPT zu erzeugen?

Es ist definitiv möglich, eigene Sprachmodelle zu trainieren, die auf den individuellen Themenbereich fokussiert sind. Das funktioniert für bestimmte Einsatzzwecke auch erstaunlich schnell – sprechen Sie uns bei Bedarf gerne hier an.

Nachhaltigkeit

Sie haben weitere Fragen zu ChatGPT, die im Beitrag noch nicht beantwortet wurden? Oder beispielsweise Interesse an einer unternehmenseigener KI? Unsere Expert:innen stehen Ihnen gerne zur Verfügung – hinterlassen Sie uns einfach eine Nachricht und wir kommen schnellstmöglich auf Sie zurück!

Über den Autor: Matthias Bauer

Matthias Bauer ist seit 2020 als Teamlead Data Science bei der X-INTEGRATE (Teil der TIMETOACT GROUP) und bringt mehr als 15 Jahre Expertise als Solution Architect mit. Daten dafür nutzen, Großes zu schaffen und Mehrwerte zu erzielen – in seinen Worten: Data Thinking – ist seine Leidenschaft. Matthias ist erfahren in Artificial Intelligence, Data Science und Data Management; dabei bedient er von Data Warehousing bis hin zu Data Virtualization ein breites Spektrum an datenbezogenen Fragestellungen.  

Matthias Bauer
CTO & Teamlead Data ScienceX-INTEGRATE Software & Consulting GmbHKontakt

Sprechen Sie uns gerne an!

* Pflichtfelder

Wir verwenden die von Ihnen an uns gesendeten Angaben nur, um auf Ihren Wunsch hin mit Ihnen Kontakt im Zusammenhang mit Ihrer Anfrage aufzunehmen. Alle weiteren Informationen können Sie unseren Datenschutzhinweisen entnehmen.