Continutul duplicat, o problema?

by BloggerIn on August 26, 2010

La sugestia lui SeeL abordez o problema destul de sensibila legata de continutul duplicat si de modul in care motoarele de cautare, in speta Google, o trateaza. Cel mai important de stiut este daca Google penalizeaza continutul duplicat sau nu.

Ce este continutul duplicat

Iata cum defineste Google continutul duplicat:

Duplicate content generally refers to substantive blocks of content within or across domains that either completely match other content or are appreciably similar.

Asadar, continutul duplicat nu se refera doar la pagini intregi, ci si la paragrafe sau blocuri de text care sunt identice sau foarte asemanatoare cu continut de pe alte pagini din cadrul aceluiasi site sau cu continut de pe alte site-uri.

Aspectele sensibile din aceasta definitie le reprezinta “substantive” (substantial) si “appreaciably similar” (foarte asemanator), ambele notiuni extrem de relative si care lasa loc de multe interpretari.  Rezultatul? Google este singurul care hotaraste daca doua pagini sau site-uri au continut duplicat, dupa algoritmi si reguli care nu sunt publice.

Ce NU reprezinta continut duplicat

Tot de la Google, iata cateva exemple de continut duplicat care este tolerat:

  • Versiuni printer-only ale unor pagini existente.
  • Versiuni ale paginilor pentru device-uri mobile.
  • Pagini care prezinta aceleasi produse in mai multe locuri in cadrul aceluiasi site.

Penalizare pentru continut duplicat?

Si da, si nu. Potrivit GoogleNU exista o penalizare pentru continut duplicat. Citez:

Let’s put this to bed once and for all, folks: There’s no such thing as a “duplicate content penalty.” At least, not in the way most people mean when they say that.

Scopul motorului de cautare Google este de a da rezultate cat mai relevante si cu continut cat mai valoros. De aceea, incearca sa detecteze continutul duplicat si sa ofere utilizatorilor sursa unui anumit text si nu copiile. 

E foarte important de retinut ca Google nu penalizeaza site-urile care publica continut duplicat decat daca acesta este menit sa manipuleze rezultatele cautarilor. Exista multe metode de a face acest lucru, inclusiv din sfera “black hat”, dar care sunt descoperite si penalizate destul de rapid.

Asadar, prin citarea sau republicarea unui articol, desi poate fi interpretat de Google ca continut duplicat, nu exista nici un pericol in penalizarea site-ului sau blogului.

Masuri de evitare a continutului duplicat

Cea mai buna sursa de informare din acest punct de vedere o reprezinta tot Google. Iata cateva sfaturi prezentate in Webmaster Guidelines:

  • Sa nu se creeze pagini, subdomenii sau site-uri cu continut duplicat.
  • Sa se evite crearea de site-uri cu putin continut original.
  • Pentru site-urile care promoveaza produse prin afiliere e necesar sa se adauge continut original, altfel nu vor fi incluse in rezultatele cautarilor.

Exista si alte reguli mai specifice care ar trebui luate in considerare:

  • Atunci cand are loc o restructurare a unui site sau blog e indicat sa se foloseasca redirectarea 301 (RedirectPermanent) in fisierul .htaccess pentru a arata motoarelor de cautare ca anumite pagini nu mai exista sau a fost mutate.
  • Sa se foloseasca Webmaster Tools pentru a indica modul in care sa se indexeze un site/domeniu (de exemplu, http://www.example.com sau http://example.com). E important de inteles ca daca acest lucru nu se face Google vede www ca subdomeniu al domeniului example.com si deci poate considera ca exista continut duplicat.
  • Link-urile catre articole anterioare trebuie sa aiba aceeasi forma de fiecare data. De exemplu, pentru http://www.example.com/page/ sa nu se foloseasca si http://www.example.com/page si http://www.example.com/page/index.htm.
  • Daca continutul site-ului sau blogului este publicat si pe alte site-uri e indicat sa se afiseze si un link catre articolul original.
  • Sa se evite folosirea de texte stufoase referitoare la copyright sau pe alte teme in footer sau in sidebar. Acestea apar in toate paginile si pot fi considerate continut duplicat.
  • E important sa se inteleaga solutia de management a continutului folosita (gen WordPress, Drupal, Joomla) si modul in care textul este publicat. De exemplu, pentru blogurile in WordPress, un articol apare pe prima pagina, in pagina dedicata, in arhiva, etc. O solutie pentru aceasta problema o reprezinta afisarea de continut partial acolo unde este posibil (pe prima pagina, in arhiva, etc.)

Ce fac daca cineva imi fura continutul?

Furtul de continut este extrem de intalnit. Exista chiar aplicatii si plugin-uri care fac acest lucru in mod automat. Asa ca nu ar trebui sa va mire sau sa va surprinda.

Ce e de facut? Nimic. Google afirma ca, aproape sigur, acest lucru nu va afecta page rank-ul si pozitionarea in rezultatele cautarilor a site-ului ce contine articolul original. Totusi, daca devine deranjant, se poate face o plangere la Google si sa se ceara scoaterea paginilor duplicate din rezultatele cautarilor.

Related Posts with Thumbnails

Vrei sa afli cum sa poti sa atragi mai multi cititori pe blogul tau,
cum poti sa il optimizezi si sa il monetizezi?

Inscrie-te la RSS


Introdu adresa de email:     

{ 4 comments… read them below or add one }

SeeL August 28, 2010 at 8:01 pm

Multumim. Sunt informatii concludente. Aveam ceva idee despre asta, insa e bine sa ne insusim cu totii aceste notiuni. Atat cei care genereaza continut original, cat si cei care copiaza continut.
Interesant – il citesc inca o data :D

3v1lM1nD September 21, 2010 at 10:51 pm

Mai fratilor numai credeti chiar tot ce spune google. Majoritatea informatiilor pe care le arunca celor ce vor sa le citeasca sunt cam de prisos si de cele mai multe ori sfideaza logica.
Asta cu continutul furat e foarte simpla vede o asemanare de 30-40 % si ignora acea pagina fara nici o problema. Nu are de ce sa pedepseasca o stire luata din alta parte sau o informatie pe care poate nici nu doresti sa o modifici pentru ca vrei sa o prezinti in forma initiala. Nu te penalizeaza nimeni dar aceasta pagina va fi vazuta de un vizitator din link in link practic nu va fi vizibila in motoarele de cautare dar tot va fi citita de cineva care intra pe site vede stirea si doreste sa o citeasca.
O problema reala exista oricum pentru ca daca tu ai un blog de rank 0 si in el ai pus un articol excelent despre un telefon mobil sa spunem si unu cu un blog de rank 5 il preia si pune postul tau la el in site vei avea o problema. Pentru ca ala de are rank 5 este indexat din 15 in 15 minute iar tu odata la 3 zile sa spunem. Daca tu ai pus postul astazi si ala il pune la el pe blog maine el tot maine va fi indexat si vazut cu continut unic iar tu vei fi indexat maine si vei fi vazut cu continut duplicitar. Ce e de facut ? pai cred ca ai 2 solutii ori apelei la aia cu copyscape sau cum le spune de iti protejeaza continutul ori scrii foarte des ca sa fii indexat la fel de rapid sau mai rapid ca cel cu blogul de rank mare.
Am vazut indexare din 3 in 3 minute de google asa ca nu prea ai sanse mari daca esti indexat la 3 zile sau la saptamana.
Asta este parerea mea despre continutul duplicitar cat despre “regulile g00gle” acestea sunt discutabile si facute pe dos pentru cei ce doresc sa le citeasca.
Tot g00gle a declarat ca page rank ul numai este de actualitate si ca el numai conteaza … pe dracu e ca si cum imi spune unu care construieste cladiri ca el numai pune parterul sau mezaninut si ca acea cladire va sta in aer.
O mare aberatie unde pr-ul este mai de actualitate ca niciodata si conteaza cel mai mult. E ca si cum mi-ar spune cineva ca maine daca un site de rank 8 pune link catre mine ca nu o sa conteze nici cat o ceapa degerata…. asta s-o spuna google lu` mutu. In fine … sunt multe de vorbit dar majoritatea lucurrilor pe care le poti face in avantajul tau este sa te uiti la calea aleasa de ei si sa incerci sa te duci inaintea lor cu cateva idei. Din pacate au inceput sa se tiganeasca si sa acorde prea multa atentie linkurilor ce vin din retelel de socializare iar in opinia mea nu are ce cauta acolo unu care comercializeaza termopan sau vinde tigari.
Practic bl@ck s3o e ce vor ei sa fie si daca ai o idee buna acum e posibil sa fie vazuta ca nasoala putin mai incolo.
PS: nu am nevoie de remarci legate de virgula, gramatica samd tineti-va parerile legate de mine si incercati sa discutati pe subiect. Multumesc frumos.

BloggerIn September 22, 2010 at 5:25 am

@3v1lM1nD – La subiect: foarte pertinent comentariul si excelent argumentat! :) Multumesc de completari!

Aurel March 16, 2011 at 10:49 am

Interesant si de luat in considerare ce scrie in acest articol! Pe de alta parte, are dreptate @3v1lM1nD in ce spune; si eu sunt de parere ca unele “reguli” Google sunt destul de relative, nu trebuie luate 100% ca atare.

Cred ca cel mai important este ca fiecare webmaster sa ia aminte de astfel de informatii si sa judece singur ce trebuie facut si ce nu pt ca site-urile lui sa aiba succes pe motoarele de cautare!

Leave a Comment

Previous post:

Next post: