OpenAI розробила метод водяних знаків для виявлення тексту, написаного ChatGPT, з надійністю 99,9%

OpenAI розробила метод водяних знаків для надійного визначення тексту, написаного ChatGPT. Компанія досі не випустила розробку, оскільки проєкт загруз у внутрішніх дебатах, які тривають майже два роки, пише Wall Street Journal з посиланням на джерела і внутрішні документи OpenAI. Система водяних знаків була готова до розгортання ще рік тому.

Співробітники компанії вагалися між заявленою прихильністю прозорості OpenAI і бажанням залучити й утримати користувачів. Компанія провела опитування серед лояльних користувачів ChatGPT, яке показало, що майже третину відлякала б технологія виявлення текстів, написаних чат-ботом.

Представниця OpenAI поділилася, що в компанії стурбовані можливістю інструменту непропорційно впливати на неносіїв англійської мови. Вона назвала метод технічно багатообіцяючим, але таким, що має важливі ризики, які оцінюють у компанії.

Прихильники інструменту в компанії, включно з тими, хто бере участь у його розробці, вважають, що аргументи супротивників тьмяніють порівняно з тією користю, яку може принести така технологія.

Генеративний ШІ здатний швидко і безкоштовно створити ціле есе або дослідницьку роботу на основі однієї підказки. Викладачі зазначають, що вони відчайдушно потребують допомоги, щоб припинити некоректне використання нейромереж.

Некомерційна організація Center for Democracy & Technology провела опитування серед учителів середніх і старших класів. Близько 59% респондентів були впевнені, що їхні учні використовували ШІ під час виконання домашніх завдань – на 17% більше, ніж попереднього року, резюмували дослідники.

ChatGPT працює на основі системи ШІ, яка передбачає, яке слово або фрагмент слова, відомий як токен, мають бути наступними в реченні. Обговорюваний в OpenAI інструмент трохи змінить спосіб вибору токенів. Рішення залишить шаблон, званий водяним знаком. Такі маркування мають бути непомітними для людського ока, але їх можна виявити за допомогою технології компанії. Детектор дає оцінку ймовірності того, що весь документ або його частина написані ChatGPT.

Внутрішні документи компанії демонструють, що водяні знаки ефективні на 99,9%, якщо ChatGPT створює достатній обсяг нового тексту.

Співробітники компанії занепокоїлися тим, що водяні знаки можна стерти за допомогою простих методів. Наприклад, перекласти текст іншою мовою і назад за допомогою Google Translate або додати емодзі з подальшим ручним видаленням у ChatGPT, заявив співробітник OpenAI.

У компанії обговорювали можливість надання детектора педагогам і стороннім компаніям, які допомагають школам виявляти написані за допомогою ШІ роботи та плагіат.

Популярні Пости

OpenAI розробила метод водяних знаків для виявлення тексту, написаного ChatGPT, з надійністю 99,9%

Популярні Пости

Avast пише що роутер вразливий, інфікований, налаштований неправильно

Як очистити історію, кеш, куки браузера Opera

Як поміняти роутер на інший новий роутер самостійно?