Pentru a putea face fata cu succes tuturor acestor chestiuni este foarte important sa urmati un tutorial optimizare seo. Frecventa de aparitie (TF) este o masura ponderata a frecventei aparitiei unui termen intr-un document. Termenii care apar frecvent in cadrul unui document sunt considerati a fi unii dintre termenii cei mai importanti ai acestui document.
Daca apare un cuvant in fiecare document (sau aproape in fiecare), acesta va spune putin despre cum sa deosebiti valoarea intre documente. Cuvintele care apar in mod frecvent vor avea o valoare de minim motiv pentru care multe motoare de cautare ignora cuvinte comune de legatura (cum ar fi, si, si sau).
Termenii rari, care apar doar intr-un numar limitat sau foarte limitat de documente, au un raport mult mai mare intre semnal si zgomot. Este mult mai probabil sa va spuna despre ce este vorba intr-un document.
Inversarea frecventei documentelor (IDF) poate fi utilizata pentru a discrimina in continuare valoarea frecventei termenilor pentru a explica modul in care termenii obisnuiti se afla intr-un conglomerat de documente. Termenii care se afla intr-un numar limitat de documente va vor spune mai multe despre acele documente decat despre termeni care sunt imprastiati in mai multe documente.
Cand oamenii masoara densitatea cuvintelor cheie, in general le lipsesc cativa alti factori importanti in recuperarea informatiilor, cum ar fi IDF, normalizarea indexului, proximitatea cuvintelor si modul in care motoarele de cautare reprezinta diferitele tipuri de elemente. (Este termenul bolded, intr-un antet sau intr-o legatura?)
Motoarele de cautare pot utiliza, de asemenea, tehnologii precum indexarea semantica latenta pentru a modela matematic conceptele de pagini conexe. Google scaneaza milioane de carti din bibliotecile universitare. La fel de mult incat acest proces are rolul de a ajuta oamenii sa gaseasca informatii, si este folosit si pentru a ajuta Google sa inteleaga tiparele lingvistice.
Daca scrieti in mod artificial o pagina umplute cu un singur cuvant cheie sau o expresie cheie fara a adauga multe dintre frazele care apar in documente naturale similare asta poate fi o problema, iar alti algoritmi pot vedea documentul ca fiind mai putin relevant. Cheia este de a scrie in mod natural, folosind diversi termeni si de a structura pagina bine.
Motoarele de cautare pot utiliza mai multe indexuri inverse pentru continut diferit. Majoritatea algoritmilor de cautare curenta dau mai multa greutate la titlul paginii si la textul linkului decat la copierea paginii.
Pentru interogari comune, motoarele de cautare pot gasi suficiente documente de potrivire a calitatii utilizand textul legaturii si titlul paginii fara a fi nevoie sa-si petreaca timpul suplimentar in cautarea prin indexul mai mare al continutului paginii. Dupa ce se colecteaza documentele cele mai relevante, acestea pot fi reordonate pe baza interconectivitatii sau a altor factori.
Aproximativ 50% din interogarile de cautare sunt unice si cu interogari unice mai lungi, exista o nevoie mai mare ca motoarele de cautare sa utilizeze si copierea paginii pentru a gasi suficiente documente de potrivire relevante (deoarece poate exista un text necorespunzator pentru o ancora pentru a afisa suficiente documente potrivite).
Algoritmul de cautare si interfata de cautare sunt folosite pentru a gasi documentul cel mai relevant in index pe baza interogarii de cautare. In primul rand, motorul de cautare incearca sa determine intentia utilizatorului, uitandu-se la cuvintele pe care le-a introdus cautatorul.