Căutare pe web în timp real

Pe scurt, despre instrumentul de căutare pe net în timp real. Concept, utilitate, limitări.


Un vis frumos

Ideal, Google n-ar avea un index de date, ci ar căuta în timp real pe toate paginile despre care are cunoştiinţă la un moment dat. Ca orice ideal, şi ăsta e intangibil, datorită limitării tehnice. Oricum, tendinţa asimptotică acolo e, odată cu scurtarea intervalului dintre update-urile indexului, care, de la site la site, se poate măsura în ore, zile sau săptămâni.

Un compromis frumos

Reflectând, studiind structura informaţiei pe website-urile moderne, răsare o rază de speranţă, o soluţie de compromis, posibilă identificând câteva principii, apoi aplicându-le. O atare soluţie parţială poate mulţumi anumite nevoi, mai ales pe aceea de acces instantaneu la noutatea online. Cele mai semnificative principii sunt:

Principiul homepage

Orice informaţie cu grad înalt de relevanţă tinde să apară iniţial pe prima pagină, cel mai adesea în rezumat. Iar ceea ce nu (mai) există pe prima pagină nu mai este relevant (strict sub aspectul noutăţii). Ergo, a căuta în timp real numai pe prima pagină poate reprezenta o variantă fezabilă pentru scopul propus - "instantaneitatea" (sic!). Dezavantajul constă, bineînţeles, în riscul de a nu găsi datele căutate, în rezumat.

În acelaşi spirit, căutarea în timp real n-are sens pe pagini vechi, acelea se află deja în indexurile motoarelor de căutare "statice". Concluzie: soluţia va considera numai căutarea pe prima pagină a surselor.

Principiul pagină-nu-RSS

Scanarea homepage poate aduce mai multe informaţii decât căutarea în flux, fie ea şi instantanee. Concluzie: soluţia va căuta obligatoriu în homepage, +/- în fluxul RSS.

Principiul surselor selecte

Tot datorită limitărilor tehnice inerente, căutarea în timp real nu-şi permite luxul de a lucra cu un număr imens de surse. Prin urmare, apare necesitatea: a) limitării numărului de surse şi b)(pre)selectării surselor în funcţie de gradul de relevanţă (generală sau particulară) prestabilit. Dar cine stabileşte şi aplică criteriile de selecţie? Clasic, administratorul sistemului. Dar am trecut de perioada clasică a web-ului. Concluzie: sursele vor fi limitate numeric din motive tehnice evidente; selecţia surselor este lăsată la latitudinea utilizatorului: este select/relevant/util pentru utilizator ceea ce consideră utilizatorul că este select/relevant/util, aşadar acesta îşi va alege singur sursele; pe scurt, număr limitat de surse, deci, cu atât mai mult, surse selectabile per utilizator.

Alte limitări

De parcă n-ajung. Ei bine, căutarea în timp real pe net depinde, inerent, de calitatea suportului surselor: servere şi conexiunile de pe parcurs. Aşa că, da, utilizatorul se poate trezi că aşteaptă câteva minute până ce o sursă oarecare răspunde.

La ce e bună?

La ce mai poate fi bună o asemenea căutare, atât de limitată? Am conceput-o ca pe un instrument ajutător pentru cel ce se documentează frecvent online: jurnalist, blogger etc., în cursa pentru a afla despre ceea ce apare nou, pe cât se poate instantaneu.

Implementarea

Ridică unele probleme, cum este cea a feedback-ului către utilizator, care trebuie să vadă ce se petrece, procesul de căutare fiind evident unul intensiv: serverul gazdă preia în timp real sursele, caută termenii daţi, returnează rezultatele. Pentru numai 20 de surse, pe un server pustiu, asta durează minute. Inacceptabil, mai ales cu o pagină goală în faţă. Concluzie: soluţia va oferi feedback în timp real, inclusiv întorcând rezultatele pe măsură ce sunt găsite.

Răspunsul tehnic: AJAX.

Alte soluţii

Fără îndoiala, există. Noi o propunem pe asta, ca model perfect scalabil, condiţionat doar de puterea hardware-ului subiacent. Acest model nu caută cu un cache sau index actualizat foarte frecvent - caută în timp real, iar ceea ce returnează este exact ceea ce există acolo la acel moment dat, fără cache de nici un fel. Dacă am fi introdus caching, nu am mai fi vorbit despre timp real.

Utilizare

E foarte simplă, folosirea vine de la sine. Singurul lucru de menţionat sunt sursele şi posibilitatea de a le ajusta preferinţelor tale, pe care le poţi salva dacă ai un cont pe Netarhia. Dacă nu, îti poţi face.

Distracţie plăcută!

0.0/5 (0 voturi)

Copyright 2008-2009. Toate drepturile rezervate.

ContactTermeni şi condiţiiPolitica de confidenţialitateNetarhia ToolsPowered by users

0.02493