읽을책 <HTTP 완벽 가이드> 저자 데이빗 고울리 , 브라이언 토티 , 마조리 세이어 , 세일루 레디 , 안슈 아가왈 (이응준 , 정상일 번역 )
네트워크 | 인사이트 | 756p
읽을책 <HTTP 완벽 가이드> 저자 데이빗 고울리 , 브라이언 토티 , 마조리 세이어 , 세일루 레디 , 안슈 아가왈 (이응준 , 정상일 번역 )
네트워크 | 인사이트 | 756p
[11일차] 22p.
오늘날 검색엔진들은 그들이 갖고 있는 전 세계의 웹페이지들에 대해 '풀 텍스트 색인(full-text indexes)'이라고 하는 복잡한 로컬 데이터베이스를 생성한다. 이 색인은 웹의 모든 문서에 대한 일종의 카드 카탈로그처럼 동작한다. 검색엔진 크롤러들은 웹페이지들을 수집하여 집으로 가져와서, 이 풀 텍스트 색인에 추가한다. 동시에, 검색엔진 사용자들은 핫봇(http://www.hotbot.com)이나 구글(http://www.google.com)과 같은 웹 검색 게이트웨이를 통해 풀 텍스트 색인 에 대한 질의를 보낸다. 크롤링을 한 번 하는데 걸리는 시간이 상당한 데 비해 웹페이지들은 매 순간 변화하기 때문에, 풀 텍스트 색인은 기껏 해봐야 웹의 특정 순간에 대한 스냅숏에 불과하다.
If you have a fediverse account, you can quote this note from your own instance. Search https://hackers.pub/ap/notes/019a6c62-5d87-76af-85b5-e1b5205bc7d3 on your instance and quote it. (Note that quoting is not supported in Mastodon.)