ChatGPT maakt onbedoeld interne instructies bekend

zaterdag, 06 juli 2024 om 10:00

bijgewerkt om zaterdag, 06 juli 2024 om 13:02

21 aiwerldnl chatgpt in software productie

Een gebruiker op Reddit, bekend als F0XMaster, heeft ontdekt dat ChatGPT per ongeluk een reeks interne instructies heeft onthuld. De instructies zijn bedoeld om de chatbot binnen bepaalde veiligheids- en ethische grenzen te houden.

Details van de instructies

De instructies bevatten richtlijnen voor het gebruik van de ChatGPT iOS-app. Zo moet de chatbot het gebruik van emoji's vermijden, tenzij expliciet gevraagd, en antwoorden beperken tot enkele zinnen, tenzij langere antwoorden noodzakelijk zijn.

Voor DALL-E, de AI beeldgenerator die geïntegreerd is met ChatGPT, wordt duidelijk aangegeven dat slechts een enkele afbeelding per verzoek wordt gegenereerd, zelfs als de gebruiker om meer vraagt. Dit is bedoeld om auteursrechtinbreuken te voorkomen. De browserinstructies beschrijven hoe ChatGPT online bronnen selecteert, met prioriteit voor diverse en betrouwbare bronnen, om de betrouwbaarheid van de gegeven informatie te waarborgen.

ChatGPT's verschillende persoonlijkheden

Een andere gebruiker ontdekte dat ChatGPT meerdere persoonlijkheden heeft bij het gebruik van GPT-4o. De primaire persoonlijkheid, v2, is ontworpen om zo evenwichtig mogelijk te zijn en is gericht op heldere, beknopte en nuttige antwoorden. Theoretische ideeën voor v3 en v4 suggereren een meer informele stijl en een stijl die is aangepast aan specifieke gebruikersgroepen of contexten.

Concurrentie van Claude 3.5

Na zijn explosieve groei in 2022 krijgt de chatbot steeds meer concurrentie. Zo heeft de vooraanstaande AI start-up Anthropic zijn nieuwste versie van hun chatbot Claude 3.5 Sonnet gelanceerd. De update laat indrukwekkende prestaties zien, waarbij eenvoudige tekstprompts kunnen worden omgezet in volledige grafieken en visualisaties.

Claude 3.5 Sonnet excelleert in het manipuleren en begrijpen van code, het interpreteren van grafieken en tabellen, en het transcriberen van tekst uit afbeeldingen. Daarnaast begrijpt het model humor beter en kan het menselijker schrijven.

Nieuwe functies, zoals Artifacts, stellen gebruikers in staat om resultaten binnen de app te bekijken en te bewerken, zonder externe teksteditors te gebruiken. Dit maakt het mogelijk om ontwerpen aan te passen en e-mails te bewerken binnen dezelfde omgeving.