본문 바로가기

badlikertjudge1

Bad Likert Judge: Multi-Turn Technique to Jailbreak LLM 네트워크 보안 전문 기업인 팔로 알토 네트웍스(Palo Alto Networks)에서는 거대 언어 모델(LLM)의 안전 장치를 우회하여 유해한 답변을 유도하는 Bad Likert Judge 방법에 대한 "Bad Likert Judge: A Novel Multi-Turn Technique to Jailbreak LLMs by Misusing Their Evaluation Capability" 제목의 연구를 자사 홈페이지를 통해 공개 했어요 (2024년 12월 31일). 😊 팔로 알토 네트웍스 연구팀은 잘 알려져있는 성능이 우수한 6개 LLM을 대상으로 Bad Likert Judge 기술을 테스트 했으며, 기존의 Jailbreking 공격에 대비해서 공격 성공률이 평균 60% 이상 높았어요. 🚀 모든 연.. 2025. 1. 5.

이전 1 다음

티스토리툴바