Wat is webwerf-indeksering? Hoe gebeur dit? U kan antwoorde op hierdie en ander vrae in die artikel vind. Webindeksering (indeksering in soekenjins) is die proses om inligting oor 'n webwerf by die databasis te voeg deur 'n soekenjinrobot, wat vervolgens gebruik word om inligting te soek oor webprojekte wat so 'n prosedure ondergaan het.
Data oor webbronne bestaan meestal uit sleutelwoorde, artikels, skakels, dokumente. Oudio, beelde, ensovoorts kan ook geïndekseer word. Dit is bekend dat die sleutelwoordbespeuringsalgoritme afhanklik is van die soekenjin.
Daar is 'n mate van beperking op die tipes geïndekseerde inligting (flitslêers, javascript).
Inisiasiebestuur
Indeksering van 'n webwerf is 'n komplekse proses. Om dit te bestuur (byvoorbeeld om die aanhegting van 'n spesifieke bladsy te verbied), moet jy die robots.txt-lêer en sulke instruksies soos Toelaat, Verbied, Vertraag deurkruip, Gebruiker-agent en ander gebruik.
Merkers en rekwisiete word ook gebruik vir indeksering, wat die inhoud van die hulpbron vir Google en Yandex-robotte versteek (Yahoo gebruik die merker).
In die Goglle-soekenjin word nuwe werwe van 'n paar dae tot een week geïndekseer, en in Yandex - van een tot vier weke.
Wil jy hê jou werf moet in soekenjinresultate-navrae verskyn? Dan moet dit deur Rambler, Yandex, Google, Yahoo, ensovoorts verwerk word. Jy moet soekenjins (spinnekoppe, stelsels) inlig oor die bestaan van jou webwerf, en dan sal hulle dit in sy geheel of gedeeltelik deurkruip.
Baie werwe is vir jare nie geïndekseer nie. Die inligting wat op hulle is, word deur niemand behalwe hul eienaars gesien nie.
Verwerkingsmetodes
Indeksering van 'n webwerf kan op verskeie maniere gedoen word:
- Eerste opsie is handmatige byvoeging. Jy moet jou werfdata invoer deur spesiale vorms wat deur soekenjins aangebied word.
- In die tweede geval vind die soekenjin-robot self jou webwerf deur skakels en indekseer dit. Hy kan jou webwerf vind deur skakels van ander hulpbronne wat na jou projek lei. Hierdie metode is die mees doeltreffende. As 'n soekenjin 'n webwerf op hierdie manier vind, beskou dit dit as betekenisvol.
Tydsberekening
Indeksering van die webwerf is nie te vinnig nie. Terme wissel, van 1-2 weke. Skakels van gesaghebbende bronne (met uitstekende PR en Titz) bespoedig die plasing van die webwerf in die soekenjindatabasis aansienlik. Vandag word Google as die stadigste beskou, hoewel dit tot 2012 hierdie werk in 'n week kan doen. OmOngelukkig verander dinge baie vinnig. Dit is bekend dat Mail.ru vir ongeveer ses maande met webwerwe in hierdie area werk.
Indeksering van 'n webwerf in soekenjins is nie vir elke spesialis moontlik nie. Die tydsberekening van die byvoeging van nuwe bladsye by die databasis van 'n webwerf wat reeds deur soekenjins verwerk is, word beïnvloed deur die frekwensie van die opdatering van die inhoud daarvan. As vars inligting voortdurend op 'n hulpbron verskyn, beskou die stelsel dit gereeld opgedateer en nuttig vir mense. In hierdie geval word haar werk versnel.
Jy kan die indekseringsvordering van 'n webwerf op spesiale afdelings vir webmeesters of op soekenjins volg.
Changes
So, ons het reeds uitgepluis hoe die webwerf geïndekseer word. Daar moet kennis geneem word dat soekenjindatabasisse gereeld opgedateer word. Daarom kan die aantal bladsye van jou projek wat daarby gevoeg word verander (beide verminder en toeneem) om die volgende redes:
- soekenjin-sanksies teen die webwerf;
- die teenwoordigheid van foute op die webwerf;
- verander soekenjinalgoritmes;
- walglike hosting (ontoeganklikheid van die bediener waar die projek geleë is) ensovoorts.
Yandex-antwoorde op algemene vrae
"Yandex" is 'n soekenjin wat deur baie gebruikers gebruik word. Dit beklee die vyfde plek onder die wêreld se soekstelsels in terme van die aantal verwerkte navorsingsversoeke. As jy 'n webwerf daarby gevoeg het, kan dit te lank neem om by die databasis te voeg.
Die byvoeging van 'n URL waarborg nie die indeksering daarvan nie. Dit is net een van die metodes waarmee die stelselrobot vertel wordoor 'n nuwe hulpbron. As daar min of geen skakels na 'n werf vanaf ander webwerwe is nie, sal die byvoeging daarvan jou help om dit vinniger te vind.
As indeksering nie plaasgevind het nie, moet jy kyk of daar enige foute op die bediener was ten tyde van die skep van 'n toepassing daarvoor vanaf die Yandex-robot. As die bediener 'n fout rapporteer, sal die robot sy werk beëindig en probeer om dit in 'n retoerbestelling te voltooi. Yandex-werknemers kan nie die spoed van die byvoeging van bladsye by die soekenjindatabasis verhoog nie.
Om 'n webwerf in Yandex te indekseer is 'n taamlike moeilike taak. Weet jy nie hoe om 'n hulpbron by 'n soekenjin te voeg nie? As daar skakels na dit vanaf ander webwerwe is, hoef u nie 'n spesiale webwerf by te voeg nie - die robot sal dit outomaties vind en indekseer. As jy nie sulke skakels het nie, kan jy die "Voeg URL by"-vorm gebruik om die soekenjin te vertel dat die werf bestaan.
Hou in gedagte dat die byvoeging van 'n URL nie waarborg dat jou skepping geïndekseer (of geïndekseer) sal word nie.
Baie mense wonder hoe lank dit neem om 'n webwerf in Yandex te indekseer. Werknemers van hierdie maatskappy gee nie waarborge nie en voorspel nie terme nie. As 'n reël, sedert die robot van die webwerf uitgevind het, verskyn sy bladsye in die soektog binne twee dae, soms oor 'n paar weke.
Proses
"Yandex" is 'n soekenjin wat akkuraatheid en aandag vereis. Werfindeksering bestaan uit drie dele:
- Search-robot deurkruip hulpbronbladsye.
- Inhoud(inhoud) van die webwerf word in die databasis (indeks) van die soekstelsel aangeteken.
- In 2-4 weke, na die opdatering van die databasis, kan jy die resultate sien. Jou werf sal (of sal nie) in soekresultate verskyn.
Indekseringstjek
Hoe om webwerf-indeksering na te gaan? Daar is drie maniere om dit te doen:
- Voer die naam van jou besigheid in die soekbalk in (byvoorbeeld, "Yandex") en kontroleer elke skakel op die eerste en tweede bladsye. As jy die URL van jou breinkind daar kry, dan het die robot sy taak voltooi.
- Jy kan jou webwerf-URL in die soekbalk invoer. Jy sal kan sien hoeveel internetblaaie gewys word, d.w.s. geïndekseer.
- Registreer op die bladsye van webmeesters in Mail.ru, Google, Yandex. Nadat jy die werfverifikasie geslaag het, sal jy die indekseringsresultate en ander soekenjindienste kan sien wat geskep is om die werkverrigting van jou hulpbron te verbeter.
Waarom misluk Yandex?
Indeksering van 'n werf in Google word soos volg uitgevoer: die robot voer al die bladsye van die werf in die databasis in, van lae geh alte en hoë geh alte, sonder om te kies. Maar slegs nuttige dokumente word by die rangorde ingesluit. En "Yandex" sluit onmiddellik alle webvullis uit. Dit kan enige bladsy indekseer, maar die soekenjin sal uiteindelik alle vullis uitskakel.
Albei stelsels het 'n inkrementele indeks. Beide lae kwaliteit bladsye beïnvloed die posisie van die webwerf as geheel. Hier is 'n eenvoudige filosofie aan die werk. Gunsteling hulpbronne van 'n bepaaldedie gebruiker sal hoër posisies in sy uitreiking beklee. Maar hierdie selfde individu sal dit moeilik vind om 'n webwerf te vind waarvan hy nie die vorige keer gehou het nie.
Daarom is dit eerstens nodig om kopieë van webdokumente van indeksering te bedek, te kyk vir leë bladsye en te verhoed dat inhoud van lae geh alte geïndekseer word.
Bespoedig Yandex
Hoe kan ek werfindeksering in Yandex bespoedig? Volg hierdie stappe:
- Installeer die Yandex-blaaier op jou rekenaar en gebruik dit om deur die bladsye van die webwerf te blaai.
- Bevestig die regte om die hulpbron in Yandex. Webmaster te bestuur.
- Plaas 'n skakel na die artikel op Twitter. Dit is bekend dat Yandex sedert 2012 met hierdie maatskappy saamwerk.
- Voeg soektog van Yandex vir die webwerf by. In die "Indeksering"-afdeling kan jy jou eie URL'e invoer.
- Voer die "Yandex. Metrica"-kode in sonder om te merk "Die indiening van bladsye vir indeksering is verbode".
- Produseer 'n werfkaart wat net vir die robot bestaan en nie vir die gehoor sigbaar is nie. Verifikasie sal met hom begin. Die werfkaartadres word in robots.txt of in die toepaslike vorm in die "Webmeester" - "Indeksering-instellings" - "werfkaartlêers" ingevoer.
Tussentydse aksies
Wat moet gedoen word totdat die webblad deur Yandex geïndekseer is? Die plaaslike soekenjin moet die webwerf as die primêre bron beskou. Daarom is dit selfs voor die publikasie van die artikel noodsaaklik om die inhoud daarvan by die vorm van "Spesifieke tekste" te voeg. Andersinsplagiate sal die rekord na hul hulpbron kopieer en sal die eerste in die databasis wees. Gevolglik sal hulle as die outeurs erken word.
Google-databasis
Vir Google is dieselfde aanbevelings wat ons hierbo beskryf het geskik, net die dienste sal anders wees:
- Google+ (vervang Twitter);
- Google Chrome;
- Google Tools for Programmers - "Scan" - "Look like Googlebot" - opsie "Scan" - opsie "Index";
- soek binne 'n hulpbron van Google;
- Google Analytics (in plaas van Yandex. Metrics).
Verbod
Wat is 'n werfindekseringverbod? Jy kan dit beide op die hele bladsy en op 'n aparte deel daarvan (skakel of stukkie teks) oorlê. Trouens, daar is beide 'n wêreldwye indekseringsverbod en 'n plaaslike een. Hoe word dit geïmplementeer?
Kom ons oorweeg die verbod om 'n webwerf by die soekenjindatabasis in Robots.txt te voeg. Deur die robots.txt-lêer te gebruik, kan jy die indeksering van een bladsy of 'n hele hulpbronopskrif soos volg uitsluit:
- Gebruiker-agent:
- Disallow: /kolobok.html
- Disallow: /foto/
Die eerste punt sê dat die instruksies vir alle PS'e gedefinieer is, die tweede een dui aan dat indeksering van die kolobok.html-lêer verbode is, en die derde een laat nie toe dat die hele vulsel van die foto-lêergids by die databasis. As jy veelvuldige bladsye of vouers moet uitsluit, spesifiseer asseblief almal in Robots.
Om die indeksering van 'n spesifieke internetblad te voorkom, kan jy die robots-metamerker gebruik. Dit is anders as robots.txtdie feit dat dit instruksies aan al die PS op een slag gee. Hierdie metatag volg die algemene beginsels van die html-formaat. Dit moet in die titel van die bladsy tussen die etikette geplaas word. 'n Inskrywing vir 'n verbod kan byvoorbeeld soos volg geskryf word:.
Ajax
Hoe indekseer Yandex Ajax-werwe? Vandag word Ajax-tegnologie deur baie webwerf-ontwikkelaars gebruik. Natuurlik het sy groot potensiaal. Daarmee kan jy vinnige en produktiewe interaktiewe webblaaie skep.
Die soekenjin-robot "sien" die weblys egter anders as die gebruiker en die blaaier. Byvoorbeeld, 'n persoon kyk na 'n gemaklike koppelvlak met verskuifbaar gelaaide internetblaaie. Vir 'n deurkruiser kan die inhoud van dieselfde bladsy leeg wees of as die res van die statiese HTML-inhoud aangebied word, waarvoor skrifte nie werk nie.
Jy kan 'n URL metgebruik om Ajax-webwerwe te skep, maar die soekenjin gebruik dit nie. Gewoonlik word die deel van die URL na diegeskei. Dit moet in ag geneem word. Daarom, in plaas van 'n URL soos https://site.ru/example, maak hy 'n toepassing op die hoofbladsy van die hulpbron wat by https://site.ru geleë is. Dit beteken dat die inhoud van die internetblad dalk nie in die databasis kom nie. Gevolglik sal dit nie in die soekresultate verskyn nie.
Om die indeksering van Ajax-webwerwe te verbeter, het Yandex veranderinge in die soekrobot en die reëls vir die verwerking van die URL's van sulke webwerwe ondersteun. Vandag kan webmeesters aan die Yandex-soekenjin die behoefte aan indeksering aandui deur 'n toepaslike skema in die hulpbronstruktuur te skep. Hiervoor benodig jy:
- Vervang die simboolin die URL van die bladsyeop die !. Nou sal die robot verstaan dat dit aansoek kan doen vir die HTML-weergawe van die inhoud van hierdie internetblad.
- HTML-weergawe van die inhoud van so 'n bladsy moet op 'n URL geplaas word waar ! vervang met ?_escaped_fragment_=.