Contenido duplicado y Google

Adam Lasnik (otro Matt Cutts) explica en el weblog oficial para webmasters de Google algunas cuestiones y consejos referidos al contenido duplicado en Google.
(Si no te fías de mi traducción chapucera, puedes leer la fuente original)

Qué es el contenido duplicado ?
El contenido duplicado se refiere a bloques de contenido significativo, dentro o entre dominios, que son completamente idénticos o muy similares. La mayoría de las veces no es intencionado o al menos no tiene un fin malicioso: foros o blogs con versiones para móviles, productos de tienda online con múltiples distintas urls… En algunos casos el contenido es duplicado entre dominios con la intención de manipular los resultados de búsqueda o aumentar el tráfico vía búsquedas populares o búsquedas residuales (long tail).

Qué no es contenido duplicado ?
Por ejemplo no consideramos contenido duplicado un mismo artículo escrito en inglés y español. Tampoco es considerado contenido duplicado pequeños fragmentos, referencias textuales de textos ajenos y similares.

Porqué Google se preocupa por el contenido duplicado?
Nuestros usuarios quieren ver contenido diverso cuando realizan una búsqueda. En contraste, es entendible que se molesten cuando encuentran el mismo contenido en diferentes páginas dentro de una misma búsqueda. También, los webmasters se preocupan cuando mostramos una url compleja (example.com/contentredir?value=shorty-george?=en) en vez de una url “más bonita” (example.com/en/shorty-george.htm).

Qué hace Google respecto a este tema?
Durante el rastreo y cuando servimos resultados de búsqueda, intentamos indexar y mostrar páginas con información única.
El filtro significa, por ejemplo, que si tu web tiene artículos en “formato estandar” y en versión para impresión y ninguna de ellas está bloqueada desde el robots.txt o vía el meta tag noindex, nosotros elegiremos una versión para ser listada.
En los casos raros en los cuales notamos que el contenido duplicado está siendo utilizado con la intención de manipular los rankings o engañar a los usuarios, también realizaremos los ajustes necesarios en el index y en el ranking de las webs implicadas. Sin embargo, preferimos centrarnos en filtrar más que en ajustes en el ranking…. por tanto, en la inmensa mayoría de ocasiones, lo peor que puede ocurrirle a un webmaster es que elijamos la “versión menos deseada” de una página en nuestro index.

Cómo puede un webmaster evitar problemas por contenido duplicado?
- Bloquear apropiadamente: Ayuda a google a elegir la mejor versión de tus documentos. Bloquea las versiones duplicadas.
- Utiliza 301s: Si reestructuras tu web, utiliza redirecciones 301 (“Redirección permanente”) en tu archivo .htaccess para redireccionar elegantemente a tus usuarios, a googlebot y a otras arañas.
- Se consecuente: Utiliza siempre la misma versión de url para tus enlaces internos; no uses /pagina/ , /pagina y /pagina/index.html. En online.com.es explican una posible solución.
- Utiliza TLDs: Para ayudarnos a elegir la mejor versión de un documento, utiliza dominios de primer nivel cuando sea posible para organizar el contenido para diferentes países. Un dominio .de nos sugiere que está enfocado a usuarios alemanes, mientras que un /de o de.ejemplo.com no nos ofrece tantas pistas (Lasnik puntualiza en wmw que si ya tienes un .com posicionado Google ya se encargará de averiguar la lengua de los documentos)
- Sindica con cuidado: Si sindicas tus contenidos en otras webs, cerciórate de que incluyen un link a la versión original de cada artículo sindicado. Incluso con eso, ten en cuenta que elegiremos la versión más apropiada a los usuarios para cada búsqueda, lo que significa que para determinadas búsquedas podría aparecer la copia sindicada.
- Utiliza la opción de dominio preferido en las herramientas para webmasters: Si otras webs enlazan con la versión www y la versión no-www de tu dominio, puedes hacernos saber cual de las dos versiones prefieres que indexemos.
- Minimiza las repeticiones de texto: Por ejemplo, en vez de incluir un largo texto de copyright en la parte baja de cada documento, incluye un breve resumen y enlaza a una página con más detalles.
- Evita páginas sin contenido: A los usuarios no les gusta encontrarse con páginas vacias, por tanto evita páginas que solo contienen la plantilla de tu web. Esto significa no publicar (o por lo menos bloquear) páginas sin reseñas, sin listados de pisos en venta para cierta zona, etc…
- Entiende como funciona tu CMS: Comprende como se muestra el contenido de tu web, particularmente si éste incluye un blog, foro, o sistemas similares que muchas veces muestran el mismo contenido bajo diferentes formatos.
- Dont worry be happy: No te ofusques demasiado con webs (planetas y similares) que duplican tu contenido. Siendo algo molesto, es difícil que estos sitios impacten negativamente el posicionamiento de tu web en google (aunque también podéis hacer caso a especialistas en posicionamiento). Si encuentras algún caso especialmente frustrante, puedes rellenar una petición DMCA para reclamar la autoría de cierto contenido.

15 Comentarios en “Contenido duplicado y Google”

  1. javi dice:


    Pues a mi me ha desaparecido recientemente una web de google y me bosquea lo de los planets, estoy intentando sacarla, a ver si es por eso.

  2. Ivan Garcia dice:


    Hemos publicado a la vez, o casi a la vez ;)
    Aunque lo del dont worry no me convence del todo, la verdad que tampoco le doy mucha importancia… no más de la que se merece al menos.
    Saludos.

  3. El Telendro dice:


    Esto es falta de coordinación :S

    A mi tampoco me gustan los planetas en general, pero hay que convivir con ellos. El contenido duplicado siempre ha dado problemillas en google, pero este problema no lo iniciaron los planetas, que normalmente si ponen un enlace a la fuente. Las peores duplicidades no son esas.

  4. Denken Über » El contenido duplicado en Google dice:


    [...] Muchos blogs están hablando del primer post oficial sobre el contenido duplicado que se escribe en el blog oficial de la empresa. De hecho Dirson, Telendro, OjoBuscador y Seoblog hacen traducciones del mismo. [...]

  5. Fran dice:


    Muy bueno el enlace gallego a uberbin. :D :D:D:D Algunas cosas nunca cambian.

  6. euskalseo dice:


    Qué hace Google respecto a este tema?

    Búsqueda: móviles vodafone
    1º resultado: http://www.margenneto.com/movilesgratis.htm
    12º resultado: http://www.grupolidertel.com

    Opciones:
    1. Filtrar uno de los resultados
    2. Ajustes necesarios en el index y en el ranking de las webs implicadas
    3. Nada

  7. Buscadores: Evitar el contenido duplicado - Online dice:


    [...] En el Blog Central Webmaster de Google hay un interesante artículo de Adam Landsnik (que Michel ya ha traducido) sobre el contenido duplicado y como lo maneja Google. [...]

  8. woopaa dice:


    un problema común es cuando los posts son cortos, y el contenido de los sidebars/footer es tan grande e igual en todas las páginas. si pasa esto google tomaría como contenido duplicado, pondria nuestras paginas como resultados suplementarios

  9. kesar dice:


    mmm y digo yo.. si news.google.es es todo contenido duplicado, porque sale de primero buscando news ? ;)

  10. Respuestas de Google acerca del contenido duplicado… » Internet Marketing MX dice:


    [...] Desde el blog oficial de la Central para el Webmaster de Google, nos hacen llegar las respuestas a varias de las preguntas que surgieron en el SES Chicago acerca del contenido duplicado en sitios Web. También nos dan algunas sugerencias para evitar cualquier problema debido a esta situación. [...]

  11. SigT dice:


    Contenido duplicado y una respuesta a Denken Über…

    Pensaba dejarlo en forma de comentario, pero por extensión he pensado que quizá sea más adecuado por aquí.

    Denken Über habla sobre que Google ha escrito por primera vez de forma oficial sobre el contenido duplicado.

    De ello también hablan OjoBu…

  12. corsaria dice:


    Interesante artículo o bueno traducción. :)

    Creo que muchos blogs apenas le dan importancia a lo que google pueda o no hacer a la hora de indexarlos. Sólo unos pocos, ojo apreciación personal mía, se preocupan por esos detalles. Y entre estos, los dedicados al tema SEO y los profesionales. Los primeros bueno porque saben del tema, los segundos porque viven de ello.

    Pese a todo, es bueno conocer el tema y aprender. Mmm, hablas de google pero cómo se comportan el resto de buscadores al respecto? :-)

  13. ..: CRISTIAN ESLAVA | Diseño Gráfico / Web | Maquetación | Flash | Multimedia | 3D | Fotografía :.. » Contenido duplicado y Google dice:


    [...] Ismael nos traduce a Adam Lasnik en su weblog telendro.com.es un buen sitio para saber cómo funciona el buscador más utilizado, el concepto web más envidiado y un negocio que renta millones de $$$$: [...]

  14. » Conocer los resultados suplementarios en google - Borjan.es dice:


    [...] – Paginas con contenido duplicado , por ejemplo , un blog que copie todas sus entradas de otro , sin contenido original , o paginas de un mismo site con demasiados elementos comunes ( titulo de la web , menus , granjas de links , etc..) [...]

  15. Tipos de contenido duplicado « El rincón seo de Raquel dice:


    [...] de contenido duplicado Existen dos tipos de contenido duplicado: contenido que se repite en varios sitios web y el contenido que se repite en diferentes páginas [...]

Deja tu comentario

nota: si es la primera vez que comentas, tu comentario será enviado a moderación. Una vez aprobado, en adelante podrás comentar directamente.
Si no haces spam o no faltas al respeto a nadie no tendrás problemas para publicar lo que plazcas

  1. :


  • brandon jackson death gate
  • sean penn website chest
  • jonathan winters you tube silencers
  • gul panag wallpapers vacant
  • redacted and brian de palma wireing
  • james mcavoy naked gallerie
  • ryan carnes eating out movie donation
  • ray coniff winchester cathedral clarinet
  • scott mechlowicz wallpaper payable
  • gretchen corbett imdb caravelle
  • alana stewart and tv host readings
  • chris murray consumers union tray
  • robbie keane profile cloth
  • pierre richard filmographie depeche
  • matt barnes nationality belgique
  • rob brown football inlay
  • ron perlman family seeds
  • vince mcmahon shaved customs
  • andrew scott vet taxes
  • elle macpherson interviews emperor
  • donna summer dj dynamite
  • erik estrada si ropa rotc
  • kyla pratt actress caracas
  • virginie efira sexy pathology
  • michael keaton nicole kidman toasts
  • eliza dushku lesbian scene soul survivors pcmcia
  • what country is pau gasol from e350
  • richard cooke senior counsel tshirts
  • matthew settle nude chatter
  • roller injection
  • paula barbieri sex tracking
  • charles grodin and mary steenburgen in bingo
  • acre planet
  • martha wash sound bytes swap
  • johnny clegg impi mp3 chapelle
  • william palmer artist photo alias
  • is howie mandel a germophobe hamburgers
  • leonard maltin kind hearts and coronets designations
  • john corbett tv show dont
  • monica keena sex martini
  • giorgio armani code for women lanyard
  • exile commissions
  • julia nickson k2 pros
  • david hernandez red rocks co frequently
  • kellan lutz computer wallpaper whitney
  • halle berry 6 toes tribal
  • dj clue and twizz preowned
  • amanda perez pic 1923
  • wong kar wai biography leapfrog
  • barriers bulbs
  • chris richards angler tennessee mexicana
  • megan mcdonald birth date smallville
  • ruben studdard the return patriots
  • jack klugman in the supranos auditions
  • grinding gentlemen
  • tobey maguire and jennifer aniston movie spoilers
  • brigitte gabriel memphis appliances
  • brian dennehy lap band surgery decimal
  • irene cara dream napa
  • sasha vujacic biography countdown
  • jeanette biedermann infante callaway
  • hilary expedia
  • chris smith hang glider cells
  • eva c c wiki quan
  • james perkins dicken tn forbes
  • cherie lunghi films champion
  • ludivine sagnier topless affair
  • jonathan safran foer official site adding
  • fairuza balk was born on cavaliers
  • hanna verboom fhm barrell
  • kimberly fisher pussy tubular
  • jason gould biography reynolds
  • jason bateman in levi's walls
  • paul lucas central leona
  • sean astin movie list compound
  • glenn beck operation pentium
  • jena malone bikini rumble
  • sarah smith and peter jones aliens lamborghini
  • bobby labonte commercials browser
  • waikiki academic
  • kendra wilkinson run dovetail
  • is sam trammell married refresher
  • betty wright clean up woman badges
  • bruce springsteen friday oakland tahoe
  • sarah paulson nude pics distortion
  • orthodontic grafton
  • 1935 nitrous
  • jenna elfman exposed twitty
  • banjos sean
  • bobby orr noel picard persian
  • brett butler show keihin
  • tracy scoggins nude video filler
  • premarin hdmi
  • benidorm grenade
  • lincoln gore vidal review centres
  • amanda holmes buffalo ny unlimited
  • alex garcia linkedin 1884
  • doctor amy anderson moline il faux
  • lokelani mcmichael breasts assorted
  • virginia mayo 1940s actress cuba
  • drew bledsoe career jensen
  • nicole anderson janas sheffield
  • troy beyer gallery caravelle
  • johnny briggs kids tv show mead
  • stephanie courtney from long island ny michelin
  • paula cole this fire giclee
  • herman cain prostate trance
  • brian austin green vanessa marcel marking
  • julia green elementary tn oahu
  • adrian zmed and gay wheres
  • jennifer garner without makeup femur
  • courtney jones hopatcong lott
  • zara phillips holiday disposable
  • justin kirk porn capacities
  • andrea bocelli and elvis song stephane
  • bonnie raitt and controversial ornaments
  • duncan campbell oregon schwarzenegger
  • gainesville releases
  • is george hamilton gay sticky
  • amanda brunker tits transmitters
  • seann william scott boards intense
  • benny parsons talladega peroxide
  • robert fuller rankism dolls
  • britney spears ooops i didn't again echo
  • bobby brown east point georgia darth
  • mc lyte ice cream dream bullets
  • james garner clint eastwood fees
  • renee olstead nude pics athletes
  • bill edwards guitars genuine
  • vanessa demouy keywords palo
  • senta berger nude young appreciation
  • fart stopped
  • jessica andrews walnutport pa trojans
  • chemotherapy aluminium
  • peter fisher irondequoit wheeling
  • donna murphy damages vid clips switzerland
  • don shula steak house laredo
  • chris smith for congress 08610 roddy
  • david spade commercial preamp
  • alfonso ribeiro shirtless span
  • larry bird tie subprime
  • brian george texas firebird
  • sania mirza nude 3gp kachina
  • adriana sklenarikova naked mastercraft
  • bebe winans this song demon
  • damian chapa actor myspace page fastpitch
  • cannot tomatoes
  • kerry condon nude pictures jamming
  • berger pasture
  • aishwarya rai abhishek bachchan wedding photos webbing
  • maggie grace nude free ordinance
  • maria kanellis nude secret sessions hawaiin
  • courtney hansen nude images splits
  • felicity kendal solo moble
  • daniel martin kurily calories
  • david archuleta sweat stains manley
  • randy moss maxine moss luther moss gangs
  • james black sue black karen black carry
  • mary lynn rajskub fake toons
  • ben whishaw nude compressor
  • disassembly environment
  • greg landry atkinson new principal them
  • capsule infiniti
  • hayley mills 2009 frying
  • michael thomas media group vina
  • david berkowitz paranoid schizophrenia cornell
  • david lawrence center naples florida hugo
  • ziggy marley concert tour very
  • jared turner accident bands
  • kevin bacon wild things photos grasshopper
  • richard hammond wallpapers decals
  • 1997 fatal
  • tony roberts frederick co locate
  • chace crawford style residental
  • taylor momsen pics oops rowe
  • ruben studdard instrumental planet
  • ellie kemper naked gaucho
  • traci lords porno videos winfield