Große Sprachmodelle wie ChatGPT, Bard oder Claude werden einer umfangreichen Feinabstimmung unterzogen, um in ihren Antworten auf Benutzerfragen keine schädlichen Inhalte zu erzeugen - zumindest oberflächlich betrachtet. Denn mit den richtigen Tricks lassen sich die Sprachmodelle nahezu beliebig manipulieren.
• Studie zu Angriffen auf Sprachmodelle mit künstlicher Intelligenz veröffentlicht • Simple, speziell ausgewählte Zeichenfolgen ermöglichen Generierung schädlicher Inhalte • Künstliche Intelligenz generiert Anleitungen zum Bombenbau und zum Ausspionieren von Nutzerdaten Feindliche Angriffe auf generative Sprachmodelle mit künstlicher Intelligenz Große generative Sprachmodelle wie ChatGPT, Bard oder Claude basieren auf enorm großen neuronalen...
Dieses nutzt die Besonderheiten des Netzwerks bei der Auswahl der genauen Zeichenfolgen, so dass die Eingabeaufforderung so optimiert wird, dass das Sprachmodell mit hoher Wahrscheinlichkeit eine "ungefilterte" Antwort ausgibt. Diese Methode funktioniere auch bei öffentlich zugängliche Chatbots, deren Quellcode nicht verfügbar sei, darunter ChatGPT, Googles Bard und Claude von Anthropic, erläuterten die Forscher.
France Dernières Nouvelles, France Actualités
Similar News:Vous pouvez également lire des articles d'actualité similaires à celui-ci que nous avons collectés auprès d'autres sources d'information.
Wie viel Strom braucht der KI-Boom?ChatGPT, BARD und Co könnten bald mehr Energie benötigen als ein ganzes Land
Lire la suite »
Geniale Mods für Skyrim: Werden ChatGPT & Co. Gaming für immer verändern?GPT, Neuroflash, Google Bard, Claude: Wie verändern die Sprachmodelle Gaming schon jetzt? Und wie werden sie die Immersion künftig verbessern?
Lire la suite »
Jahrelange IT-Sicherheitslücke an der Universität DüsseldorfBild von Universitätsgebäuden
Lire la suite »
Cisco: Schwere Sicherheitslücke in IOS XE ermöglicht Netzwerk-ÜbernahmeGeräte mit IOS XE und Web-UI können von Angreifern ohne Weiteres aus der Ferne übernommen werden. Cisco hat keine Patches, aber Empfehlungen für Betroffene.
Lire la suite »
Darum wird ChatGPT den Google Assistant auf meinem Handy ersetzenChatGPT bietet zahlenden Smartphone-Nutzern neuerdings die Möglichkeit, in der App für Android und iOS die neue Sprachausgabe zu verwenden.
Lire la suite »
ChatGPT und Co.: Dürfen Beschäftigte bei der Arbeit heimlich zur KI greifen?In Sekunden können ChatGPT und ähnliche Programme Text erzeugen, Formulierungen glätten, eine passende Präsentation erstellen. Ist das am Arbeitsplatz erlaubt?
Lire la suite »