Současné metody indexování webu, jež používá Google a drtivá většina dalších vyhledávačů, jsou relativně pomalé, zejména u méně známých webů. Když totiž vydají nový obsah, musí počkat, než je indexovací robot znova navštíví a uloží do databáze, což může trvat až několik dní.
PuSH je nová technologie, na které se v Googlu již jistou dobu pracuje. Slouží k indexování stránek v realtime, tedy reálném čase (v řádu jednotek sekund). Založena je na formátu ATOM a hubech, které v případě vydání nového obsahu pošlou upozornění všem odběratelům namísto toho, aby odběratelé v pravidelných intervalech sami kontrolovali novinky.
Google brzy představí dokumentovaný formát, který majitelům stránek řekne, co mají vložit do hlavičky svých webů, aby Google o jejich hubu věděl. Jakmile Google takový hub najde, zaregistruje se a v případě vydání novinek na příslušném webu hub sám Googlu okamžitě pošle o této skutečnosti zprávu, což umožní web indexovat pár sekund po aktualizování.
Zdroj: ReadWriteWeb




Re: Google připravuje novinku v hledání. Bude indexovat ...
Chápu-li to dobře, tak Google začne využívat RSS, které budou mít všechny stránky. Mno to tu mohlo být už před pár lety ^^
Re: Google připravuje novinku v hledání. Bude indexovat ...
Nikoliv, nic takového v novince není. U RSS musí odběratel pravidelně sám kontrolovat daný kanál, zdali v něm nejsou novinky, takže by Google musel kanál prohledávat každých pár sekund, aby dosáhl zmíněného indexování během pár sekund. Technologie Googlu používá huby (servery), které v případě vydání novinek, odběratelům samy pošlou okamžitě upozornění, aniž by se odběratel sám "ptal". Provozovatelé webů, kteří chtějí tuto rychlou indexaci vloží do hlavičky webu speciální informaci, která způsobí, že se Google automaticky zaregistruje u jejich hubu, jakmile tuto informaci běžným způsobem najde a v případě publikování nových informací je Google upozorněn daným hubem.
Tato technologie se ovšem nedá vyvinout přes den, takže před pár lety tu zřejmě být nemohla. Musí se stanovit formát hlavičky pro majitelé webů, implementovat registrování u hubů a samozřejmě příjem novinek a rovněž je nutná ochrana proti spamu a zneužití a řada dalších věcí.
Re: Google připravuje novinku v hledání. Bude indexovat ...
:-D ale to je zase blabol... podobna, ne-li stejna technologie uz davno existuje, vyuziva ji spousta redakcnich systemu. Google je uz par let schopny zaindexovat stranku jen par vterin po jeji publikaci. Jen to neni jeho patent... o ten se ted prave snazi.