뉴스 매체들이 AI 스크래핑 우려로 Internet Archive 접근을 제한
------------------------------
- 주요 언론사들이 *AI 학습용 데이터 수집* 을 막기 위해 Internet Archive의 접근을 차단하거나 제한 중임
- The Guardian 은 Internet Archive의 API와 Wayback Machine에서 기사 페이지를 제외하고, 일부 홈·토픽 페이지만 남김
- The New York Times 는 2025년 말부터 archive.org_bot을 robots.txt에 추가…
------------------------------
https://news.hada.io/topic?id=26699&utm_source=googlechat&utm_medium=bot&utm_campaign=1834
If you have a fediverse account, you can quote this note from your own instance. Search https://sns.lemondouble.com/notes/aiqq8yos61 on your instance and quote it. (Note that quoting is not supported in Mastodon.)