Prompt puppetry – czym jest, jak działa i dlaczego to ważne dla bezpieczeństwa AI
Wraz z popularyzacją modeli językowych pojawiły się nowe klasy zagrożeń. Jedną z nich jest prompt puppetry – technika, która pozwala tak „ustawić” model AI za pomocą odpowiednio zbudowanej treści, roli, formatu i kontekstu, by ominąć część jego zabezpieczeń lub skłonić go do zachowania, którego normalnie nie powinien wykonać. Sam termin został nagłośniony przez badaczy HiddenLayer, […]
Czytaj więcej