JiraiBench: A Bilingual Benchmark for Evaluating Large Language Models' Detection of Human Self-Destructive Behavior Content in Jirai Community
arxiv.org/abs/2503.21679 심각한데 웃겨 죽을 것 같다. 제목이...
RE: https://bsky.app/profile/did:plc:a6qvfkbrohedqy3dt6k5mdv6/post/3mc3asjbxt22r
JiraiBench: A Bilingual Benchm...
If you have a fediverse account, you can quote this note from your own instance. Search https://bsky.brid.gy/convert/ap/at://did:plc:a6qvfkbrohedqy3dt6k5mdv6/app.bsky.feed.post/3mc3asyyvl22r on your instance and quote it. (Note that quoting is not supported in Mastodon.)
본 논문은 중국과 일본 소셜 미디어 커뮤니티에서 자해 관련 콘텐츠를 탐지하는 대규모 언어 모델의 효과를 평가하기 위한 최초의 이중 언어 벤치마크인 JiraiBench를 소개합니다. 중국어 콘텐츠를 처리할 때 일본어 지시어가 예상치 못하게 중국어 지시어보다 우수한 성능을 보였습니다.
ㅋㅋㅋ AI조차 오타쿠의 라틴어는 일본어인 것이다...
RE: https://bsky.app/profile/did:plc:a6qvfkbrohedqy3dt6k5mdv6/post/3mc3asyyvl22r