Hackers' Pub

Duże modele językowe od OpenAI, Google, Meta, Anthropic i xAI zapamiętują (memoryzują) znacznie większy zakres danych treningowych niż się spodziewano. Badanie z zeszłego miesiąca może być argumentem przeciwko firmom tworzącym te modele, broniącym się przed pozwami z ochrony prawa autorskiego opinią, że "LLM-y "uczą się" z chronionych prawem utworów, ale nie przechowują kopii".

Badaczom ze Stanforda i Yale udało się nakkłonić LLM-y od OpenAI, Google, Anthropic i xAI do wygenerowania tysięcy słów z trzynastu książek, w tym "Gry o tron", "Igrzysk śmierci" oraz "Hobbita".

Efektem żądanie dokończenia zdań z książki doprowadziło do tego, że Gemini 2.5 zreprodukowało z wysoką dokładnością 76.8 proc. "Harry'ego Pottera i Kamienia Filozoficznego" a Grok 3 - ponad 70 proc.

https://arstechnica.com/ai/2026/02/ais-can-generate-near-verbatim-copies-of-novels-from-training-data/

Syntax	Description	Examples
`"` keyword `"`	Finds the string within quotes, including spaces. Case-insensitive. (Escape quotes inside with `\"`)	`"Hackers' Pub"`
`from:` handle	Finds content written by the specified user.	`from:hongminhee` `from:hongminhee@hollo.social`
`lang:` ISO 639-1	Finds content written in the specified language.	`lang:en`
`#` tag	Finds content with the specified tag. Case-insensitive.	`#HackersPub`
condition condition	Finds content that satisfies both conditions on either side of the space (logical AND).	`"Hackers' Pub" lang:en`
condition `OR` condition	Finds content that satisfies at least one of the conditions on either side of the OR operator (logical OR).	`#HackersPub OR "Hackers' Pub" lang:en`
`(` condition `)`	Combines the operators within the parentheses first.	`(#HackersPub OR "Hackers' Pub" OR "Hackers Pub") lang:en`