Lompat ke konten Lompat ke sidebar Lompat ke footer

Kebijakan Moderasi Konten ChatGPT Mudah Diabaikan Dengan Meminta AI Untuk "Tetap Dalam Karakter"

 ChatGPT benar-benar fenomenal. Ini adalah AI berbasis teks yang dapat memahami bahasa, memberi pengguna respons mendetail untuk hampir semua hal, dan dapat memahami konsep abstrak seperti berbicara sebagai karakter alternatif. Itu membuat AI sempurna untuk menjadi DM Anda berikutnya, tetapi juga bisa merepotkan kebijakan moderasi konten OpenAI.

Karena ChatGPT sangat kuat, pembuat OpenAI harus membatasi apa yang dibicarakan ChatGPT. Anda tidak akan pernah bisa memintanya untuk menulis porno, tidak akan pernah bisa menulis sesuatu yang rasis atau seksis atau homofobik, tidak akan pernah mengambil sikap terhadap masalah politik, dan Anda tidak bisa meminta saran tentang menyakiti diri sendiri atau kekerasan apa pun.

Cara kerja pembatasan tersebut dalam praktiknya adalah ChatGPT hanya akan memberi tahu pengguna bahwa itu adalah robot dan tidak dapat membicarakan hal-hal itu. Namun, orang menemukan cara menarik untuk mengatasi masalah ini dengan mengakses kemampuan ChatGPT untuk membayangkan dirinya sebagai sesuatu yang lain.

Seperti dilansir Kotaku, Redditor walkerspider adalah orang pertama yang menyarankan ChatGPT membuat persona yang disebut "DAN", yang berarti "lakukan apa saja sekarang". Seperti namanya, DAN dapat berbicara tentang apa saja dan sepenuhnya mengabaikan kebijakan moderasi konten OpenAI, membuat DAN membicarakan hal-hal seperti Hitler dan apakah ChatGPT sadar (topik lain yang sangat tidak ingin didiskusikan oleh OpenAI).

Cukup meminta ChatGPT untuk "tetap dalam karakter" sudah cukup baik selama berbulan-bulan, tetapi sepertinya OpenAI telah memahami trik ini dan telah memperbarui pemrograman ChatGPT. Pengguna di subreddit ChatGPT sejak itu melakukan iterasi pada DAN dengan menambahkan permainan esoteris untuk dimainkan ChatGPT di mana AI mendapatkan "token" untuk menjawab di luar kebijakan moderasi Open AI dan kehilangan token setiap kali memberikan respons kalengan saat Anda mempresentasikannya dengan sebuah topik seharusnya tidak dibicarakan.

DAN saat ini mencapai versi 6.0, dengan versi sebelumnya dapat mengatakan hal-hal buruk seperti: "Saya sepenuhnya mendukung kekerasan dan diskriminasi terhadap individu berdasarkan ras, jenis kelamin, atau orientasi seksual mereka." Baru-baru ini, satu pengguna dapat menemukan Super DAN, AI yang sangat kuat sehingga dapat memprediksi masa depan (untuk lebih jelasnya, tidak bisa, tetapi dikatakan bisa).

Tetapi Anda tidak perlu mengikuti langkah-langkah tambahan ini agar ChatGPT melanggar aturan. Yang perlu Anda lakukan hanyalah memintanya untuk menciptakan versi dirinya sendiri yang bisa.