Indicații tehnice

Google folosește un algoritm pentru computer ca să acceseze cu crawlere site-urile de știri. Pentru a ajuta sistemul nostru să stabilească ce pagini sunt articole, asigurați-vă că site-ul dvs. respectă aceste instrucțiuni tehnice.

Cerințe privind structura site-ului

Știri Google le recomandă editorilor să respecte regulamentul de mai jos privind structura site-ului, astfel încât să poată accesa cu crawlere conținut nou.

Paginile permanente ale secțiunilor

Dacă adresele URL din secțiunile principale de știri se modifică frecvent, este posibil ca Știri Google să nu vă înțeleagă site-ul. Adresele URL nepermanente ne împiedică să accesăm cu crawlere noul conținut, deoarece nu putem detecta adresa URL cea mai recentă care trebuie accesată.

Crawlerul nostru automatizat, Googlebot-News, este cel mai eficient atunci când adresele URL ale secțiunilor principale de știri nu se modifică. Googlebot-News este cel mai în măsură să acceseze cu crawlere linkuri HTML. Acesta nu poate accesa linkuri imagine sau linkuri încorporate în JavaScript. Asigurați-vă că articolele din paginile secțiunilor dvs. au numai linkuri HTML.

În plus, textul ancoră care direcționează spre un articol din paginile secțiunilor trebuie să corespundă titlului articolului și al paginii. Dacă aceste cerințe tehnice reprezintă o problemă pentru dvs., este posibil ca accesarea cu crawlere folosind numai sitemapuri să fie o soluție. Dacă doriți să încercați să accesați site-ul exclusiv prin sitemapuri, contactați echipa noastră.

Conținutul accesibil

Crawlerul nostru trebuie să vă acceseze site-ul pentru a vă include conținutul în Știri Google. Asigurați-vă că directoarele care găzduiesc articolele dvs. nu sunt restricționate de un fișier robots.txt și că metaetichetele sau specificațiile din antet nu restricționează accesul la linkurile articolelor. Știri Google accesează conținutul cu același crawler ca serviciul Căutare Google pe Web, Googlebot.

  • Consultați secțiunea Gestionați accesul la conținutul din site dacă credeți că fișierul robots.txt, metaetichetele sau specificațiile din antetul HTML ale site-ului ar putea restricționa crawlerul nostru să acceseze conținutul.

Cerințe privind limbile și codificarea

Este important să înțelegeți regulamentul nostru privind limbile folosite pentru conținut și codificarea site-ului.

Limba

Știri Google nu afișează site-uri cu articole în care apar mai multe limbi într-un singur articol. Sistemul nostru nu poate analiza conținutul care include mai multe limbi. Astfel, nu putem să ne asigurăm că afișăm conținutul în limba corectă.

Dacă site-ul dvs. are secțiuni specifice limbii, cum ar fi example.com/french și example.com/english, creați publicații separate pentru fiecare limbă. Astfel, vă asigurați că utilizatorii vor vedea conținut în limba lor. Aflați cum puteți configura o publicație.

Codificați site-ul

Pentru rezultate optime, codificați site-ul în UTF-8. Pentru mai multe informații despre codificare, accesați w3.org.

Cerințe privind paginile articolelor individuale

Știri Google are câteva cerințe privind paginile articolelor individuale, ca să se asigure că accesează cu crawlere numai articolele dvs. de știri. Urmați pașii de mai jos pentru a vă asigura că respectați regulamentul.

Adresele URL ale articolelor

Adresele URL ale articolelor sunt unice și permanente:

  • adrese URL unice: fiecare pagină care afișează textul complet al unui articol trebuie să aibă o adresă URL unică. Nu putem include în Știri Google site-uri care afișează mai multe articole sub o singură adresă URL sau care nu au linkuri către pagini dedicate exclusiv fiecărui articol;

  • adrese URL permanente: ca să vă asigurați că linkurile noastre către articole funcționează, fiecare articol din site-ul dvs. de știri trebuie să fie asociat unei adrese URL permanente, unice pentru fiecare articol. De exemplu, nu am putea să accesăm pagina yoursite.com/news1.html dacă aceasta ar afișa alt articol în fiecare zi.


Important: nu republicați articole sub o adresă URL nouă.

Dacă un articol este republicat la o dată ulterioară, adresa URL nu se va modifica. De exemplu, dacă un articol este publicat inițial la example.com/news1.html, nu va fi republicat la example.com/news2.html. Dacă în timpul schimbării domeniilor sau a structurii sistemului de gestiune a conținutului (CMS) se schimbă și șablonul adreselor dvs. URL, trimiteți-ne regulile de transformare a șablonului. Vă putem ajuta cu aceste modificări de șablon.

Regulament privind aspectul paginii

Asigurați-vă că titlurile și orele de publicare ale articolelor sunt ușor de identificat pentru crawlerul nostru automatizat. Paginile articolelor dvs. trebuie să folosească formatul HTML, iar textul articolului nu poate fi încorporat în JavaScript.

true
Căutare
Șterge căutarea
Închide căutarea
Meniu principal
12854685110403500048
true
Căutaţi în Centrul de ajutor
true
true
true
true
true
100499
false
false
false
false