"Hackear Google" en I THINK GOOGLE.com
Una recopilación testimonial de un problema grave: el Googlejacking
Nota: las técnicas aquí mencionadas no disponen de
un enfoque fértil y una metodología de descubrimiento orientada. La
presente pagina reúne de manera testimonial y anecdótica textos curiosos
para evaluar tendencias y grado de madurez.
COMIENZA LA REGRESIÓN AL INFINITO Y SE DESCUBREN LOS
METALENGUAJES
Hace escasas fechas dirson publicaba en España el peligro del Googlejacking, según el cual un webmaster malintencionado puede fácilmente 'secuestrar' los contenidos de cualquier otra página web mediante redireccionamientos y absorber el pagerank que Google concede a la página en cuestión, hasta hacerla desaparecer de los usuarios.
El tema es de notoria gravedad, dada la popularidad que la gente de 'Dark SEO Team' consiguió a través del experimento realizado a través de una de sus páginas para que obtuviese un PageRank=10 (el máximo posible), y, tal como apunta dirson, días después explicó cómo lo habían conseguido: mediante una sencilla redirección 301 hacia 'google.com'. Habían logrado 'secuestrar' la página principal de Google.
Síntomas de Googlejacking
Generalmente puede afectarle a páginas bien posicionadas y con un pagerank en búsquedas competitivas que desaparecen de esta posiciones sin motivo alguno, con la consecuente bajada de tráfico.
Al buscar tu sitio en “site:www.mydomain.com” se puede comprobar si la página índice o no aparecía o aparece en la tercera o cuarta página de los resultados, después de todas las páginas suplementarias del sitio.
Cómo saber si estoy secuestrado por el Googlejacking
Para conocer o descubrir si alguna de nuestras páginas ha sido secuestrada, debemos proceder de la siguiente forma, siguiendo nuevamente a dirson:
• Hacer una búsqueda 'allinurl:midominio.com'. Si, dentro de los resultados de búsqueda, hay alguna página con una URL diferente de las nuestras, probablemente estemos sufriendo un 'Googlejacking', especialmente si al hacer clic sobre el enlace, aparece nuestro sitio.
• Para mayor seguridad podemos utilizar un visor de cabeceras HTTP para comprobar si las páginas que hemos encontrado con diferente URL están realmente redireccionando (hacia las nuestras páginas. Al utilizar una herramienta visor de cabecera sobre la dirección del sitio se comprobará que quizás se esté utilizando un enlace 302 para enlazar a nuestro sitio.
Como solucionar el Googlejacking
En una primera impresión, el problema es que no había soluciones posibles, a la espera de la mejor de las soluciones: que el propio Google se ocupara de buscar la solución al problema.
No obstante, el tema ha sido tratado ampliamente, dada la preocupación que ha generado entre los webmaster de todo el mundo (por ejemplo webmasterworld.com) avanzando algunas soluciones para eliminar una página de un secuestrador del indice Google.
Esta solución que contamos paso a paso se ha generado en el contexto de webmasterworld que pasa por remover o quitar la página. O sea:
• Entrar en la página de Google para remover la página.
http://www.google.com/intl/en/remove.html#exclude_pages
• Hacer clic en el enlace “urgent”
Posteriormente hay que seguir los pasos siguientes:
1. Inscribirse en una cuenta con Google y contestar el correo electrónico que te envían.
2. Añadir la meta “noindex” según sus instrucciones, y subirlo a tu sitio.
3. Siguiendo las instrucciones para quitar una página del índice de Google, se mete la dirección del secuestrador que se redirige hacia nuestro sitio (copiando y pegando del resultado de la búsqueda “allinurl”). Hay que quitar un espacio de la dirección para que funcione bien.
4. Se recibirá un mensaje en el que se nos dice que se atenderá nuestra petición dentro de 24 horas. La dirección que hemos remitido se mostrará en la parte arriba de la derecha de nuestra pantalla con las palabras "removal of (url del secuestrador) pending."
5. A continuación se elimina la meta "noindex" de nuestra página y se vuelve a subirlo a nuestro sitio. Aunque en las próximas horas la cuenta de google todavía diga que la eliminación del url está pendiente, al hacer búsquedas “site” y “allinurl” probablemente ya no aparecerá la dirección del secuestrador, y habrá vuelto la dirección de nuestra página índice.
Conclusiones y especulaciones
El post original en el foro de webmasterworld (en inglés) lleva a cabo algunas consideraciones interesantes sobre este problema. Cuenta lo siguiente, traducido:
En algún momento en septiembre del año pasado, Google cacheó el url de la página secuestradora que apuntaba hacía mi sitio. Al entrar ambas direcciones y comparar el contenido, Google penalizó mi sitio por tener contenido duplicado. Mi sitio fue el único sitio castigado por Google porque era el único sitio que existía de verdad. La página del secuestrador no fue penalizada porque solo existía como un redireccionamiento a mi sitio.
Como mi página principal estaba castigada, prácticamente desapareció de los SERPS aunque algunas de mis páginas suplementarias aparecían en resultados de búsquedas más complicadas.
Como todavía no he recibido respuesta del webmaster del secuestrador, el 302 está todavía en su sitio, pero está ya muy enterrado y el último caché de Google tuvo lugar en septiembre. Así que con un poco de suerte, Google no volverá a indexarla durante bastante tiempo.
1
DARK SEO TEAM
Proyecto Pagerank 10
DARK SEO TEAM
Par Vuln, dimanche 16 janvier 2005 à 15:18 ::
Projets ::
#19 ::
rss
Antes de explicar las técnicas utilizadas, conviene recordar que el
contenido de este artículo es únicamente de carácter informativo y que
no seremos responsables, bajo ninguna circunstancia, por la manipulación
que podáis realizar en los resultados de Google o de cualquier otro
motor de búsqueda.Cronología :
- 1 Diciembre 2004: puesta en marcha del script que permite obtener
el Pagerank deseado.
- 16 Diciembre 2004: obtención de nuestro primer Pagerank 10.
- 19 Diciembre 2004: publicación de nuestros primeros trabajos sobre
el Pagerank.
- Hasta hoy : test y observación del comportamiento de los
buscadores, lectura de las reacciones en los forums FR, US, ES, DK,
RU, etc.
Objetivo :
Demostrar la existencia de una falla crítica en el sistema de
Pagerank y comprender las consecuencias que puede provocar esta falla.
Esta vulnerabilidad existe desde hace mas de un año, deseamos que
Google© solucione este bug que afecta a webmasters, empresas,
particulares, SEO y…motores de búsqueda.
Concepto :
Estas fallas hicieron su aparición a principios del 2004. En febrero de
ese año nos dimos cuenta que hacer redirecciones salvajes hacia otros
sitios tenía por consecuencia el generar comportamientos extraños de
Googlebot y de las páginas de resultados de Google. Todos los tipos de
redirecciones están concernidos :
- Redirection 301 : Moved Permanently
- Redirection 302 : Moved Temporarily
- Meta-Refresh à 0 segundos
- Iframes, frames et javascript
Cada una de estas redirecciones, según la popularidad de la página
emisora de la redirección, puede tener enormes consecuencias sobre el
"objetivo" de la redirección.
La palabra Pagerank no significa nada hoy en día, o sí precisamente,
ella tiene varias significaciones que hay que distinguir claramente :
- el Pagerank que el navegador indica mediante el cálculo del
checksum (IE o FF): éste corresponde a un viejo Pagerank que es
actualizado de manera esporádica.
- el Pagerank del directorio Google: DMOZ.
- el Pagerank "real", aquel utilizado por Google de manera escondida
en su algoritmo de clasificación.
Impacto sobre los Motores de Búsqueda: :
| + |
|
- |
| Para indexar un nuevo sitio, si tenemos el PR10, y
que lo quitamos una vez obtenido, parece que estos nuevos sitios no
están afectados por el efecto sandbox. |
|
Permite hacer desaparecer un competidor con una
popularidad menos elevada que la página que tiene la redirección.
(Puede estar también considerado como una ventaja :p) |
| Tener una página web con un PR 10 para encontrar
novia…:p |
|
Algunos tipos de redirecciones permiten de
intercambiar las posiciones con las de su competidor. Así un
competidor mejor posicionado sobre ciertas palabras-claves sería
"destruido" con una simple redirección. |
| No hemos querido probar lo siguiente, pero ¿qué
pasaría si colocamos un robots.txt Disallow:/ en el directorio raíz
de nuestro sitio PR 10 redirigido a Google.com y que después vamos a
Google Remove para actualizar este robots.txt en 24H? ¿Google se "autodesposicionaría"? |
|
En el marco de intercambio de enlaces, cualquiera
puede entonces simular sitios web con un PR 5,6,7 o 8 para negociar
con ventaja enlaces más interesantes… Si tenemos en cuenta la
actitud de algunos webmasters que prefieren concentrarse sobre el PR
en lugar del contenido, será importante en lo sucesivo de verificar
el buen PR del sitio directamente en google. |
Algunas técnicas que hemos imaginado todavía no han sido probadas, las
únicas consecuencias inmediatas han sido las de suprimir las páginas del
sitio www.pr10.darkseoteam.com previstas para obtener un PR4, PR3, PR2,
PR2 et PR0. Estas páginas, al tener un Pagerank escaso, corrían el
riesgo de desaparecer durante el test, razón por la cual las hemos
suprimido.
En cuanto a la frecuencia de visitas del robot de Google, ésta
corresponde al verdadero Pagerank de vuestro sitio. Una página PR10 no
será más visitada ni mejor clasificada. Las páginas linkeadas no reciben
ninguna transmisión del PR10, puesto que como lo veis en el script
adjunto, simulamos el hecho de ser una otra página web, y en nuestro
caso, hemos hecho creer a Google…que éramos Google (como ha remarcado
Sam ; -)).
De acuerdo con nuestras observaciones, parece que la etiqueta meta-refresh
perturba también a Yahoo! que pierde la cabeza con directivas de tipo:
site:site1.com que indica en la lista de resultados de las páginas del
site1 la url de www.site2.com hacia la cual site1 ha hecho una
redirección (queda claro? ;p).
En cuanto a la pregunta vista en el foro de ¿cómo podríamos
aprovecharnos de este bug? la solución reside ciertamente en el hecho de
poder salir gracias a este "truco" del sandbox y de poder indicar el PR
deseado. Sin embargo, sus consecuencias son nefastas.
Así, numerosos webmasters se divierten con este tipo de consecuencias.
En especial, debemos otorgar una cartulina roja a ciertas sociedades de
afiliación que trabajan únicamente con este tipo de redirecciones, y que
se aprovechan de ello para posicionar su enlace de redirección (con el
pretexto de no controlar este fenómeno).
El peligro es grande para cada uno de nosotros, webmasters, empresas,
sociedades de servicios, etc, estamos sometidos a la voluntad de Google
que es quién decide a qué página debe asignar el contenido de las
redirecciones.
Lo más peligroso en términos de "robo" de Pagerank y de posición es
la etiqueta meta-refresh y los grupos iframes, frameset y javascript que
permiten todo lo peor y que parecen irreversibles por el momento. Las
redirecciones 301 y 302 son también peligrosas, pero con la retirada de
las redirecciones, la situación vuelve a la normalidad después de un
determinado plazo de tiempo.
La clave del proceso ha sido conseguir que el número de
<a href="http://google.dirson.com/posicionamiento.net/backlinks/">backlinks</a>
que muestra Google hacia dicha página sea de
<ahref="http://www.google.com/search?q=link%3Ahttp%3A%2F%2Fwww.pr10.darkseoteam.com">
casi 3 millones</a> (justo la misma cantidad que <a href="http://www.google.com/search?q=link%3Ahttp%3A%2F%2Fwww.google.com">
tiene la página principal de Google</a>). Esta cifra es completamente
ficticia, y se basa en un fallo que sufre el cálculo de este valor por
parte del buscador, y que fue descubierto hace unos meses.
Hay que recordar que, desde hace mucho tiempo, el valor del PageRank es
uno de los muchos parámetros que utiliza Google para posicionar una
página dentro de sus resultados de búsqueda, y la variable fundamental
para el cálculo del PR es el número de 'backlinks'. Es verdad que un PR
alto puede suponer un buen <a href="http://google.dirson.com/posicionamiento.net/">posicionamiento</a>,
pero no es -ni mucho menos- el parámetro más influyente.
Les hemos hecho esperar mucho, he aquí el código utilizado:
<?php
// Dark Seo Team Powered
Cloakin' Stuff // -> MakeYouWorkALittle (-;
if (GooglebotStealMyPage&Content)
{ // Code only for Google
header("Status: 301 Moved Permanently");
header("Location: http://www.google.com");
exit();
}
else {
echo "I Steal His PR""; // visual page for all
// copy here all cool stuff u want
}
?>
Redirección 301
Se trata de configurar una página web para que, cuando llegue el robot del
buscador, éste sepa que la página se ha movido definitivamente a otra nueva
dirección (URL). Mediante este redireccionamiento, se traspasarán al mismo
tiempo los valores de PageRank y de backlinks que ya disponíamos en nuestra
vieja URL.
Este número 301 se trata realmente de un 'estado' del servidor web. Al igual que
nos encontramos con los mensajes '404 Not Found' o '500 Internal Server Error',
el '301 Moved Permanently' se trata de un estado de los estándares del protocolo
HTTP.
Sin embargo, este estado se puede crear fácilmente por parte del webmaster, si
éste tiene acceso a herramientas de programación del lado del servidor (PHP o
ASP, por ejemplo o a la configuración del propio servidor.
Redirección 301 con PHP (en la página que queramos redireccionar)
<?
Header( "HTTP/1.1 301 Moved Permanently" );
Header( "Location: http://www.nueva-direccion.com" );
?>
Redirección 301 con ASP (en la página que queramos redireccionar)
<%
Response.Status="301 Moved Permanently"
Response.AddHeader "Location", "http://www.nueva-direccion.com"
%>
Mediante RedirectMatch 301 (módulo 'mod_alias' de Apache)
Echa un vistazo al manual de este servidor web.
Have You Experienced A Web Page Hijacking?
This article was written to show innocent parties, who have experienced
Hijackings with 302 Redirects, or meta refresh redirects, no follow meta tags,
and other deceptive redirects, how to recognize when someone is hijacking your
web page.
302 redirects tell the search engine that the page's information has moved
temporarily to the hijackers web site and that information now belongs to the
hijacker. Once a web page is hijacked the PR (page rank) of the victim site
quickly drops in Google as it wrongly attributes the victim's content to the
page with the 302 redirect so the redirect needs to be removed before it
destroys the site completely. Some of these 302 redirects are merely tracking
URLS and are not a deliberate attempt to hijack your web page so please read all
of the following before taking action. Google is attempting to remove this as a
hijacking method also, so hopefully this page will be obsolete some day. This
page is updated as more methods of hijacking web pages are discovered and their
solutions, so check back often.
Update:
As of mid April 2005 Google said it implemented changes in it's
algorithum so it wouldn't attribute 302 redirects to the wrong site's index
anymore. This doesn't necessarily mean the 302 redirect problem is solved, only
that we have to look elsewhere to find them.
Also see: Stop Those who are Stealing your Content
There are many metods of hijacking a web page and a website's PR:
What Benefit is there in Hijacking A Web Site?
The reason a hijacker installs 302 redirects or another deceptive redirect to
your website is for the purpose of stealing your traffic, your Keyword Rank and/or
PR (page rank). The hijacker gets the benefit of the PR and Keyword Rank that
you have worked so hard for and thus you may not only loose what rank your
website has gained in the search engine you may also be penalized for various
reasons depending on the kind of 302 redirects being used by the hijacker.
How to Tell if your Website has been Hijacked:
See more information on How to Find a Hijacker
Hijacking Examples
1. ID Redirects
2. Meta Refreshes
3. 302 Redirects
4. Rel=no follow
5. Frames
6. Your Title in Their Title
7. Bad Links = Split Domain
8. Tracker 2
Hijacking Example 1 with an ID Redirect
If the link includes another sites URL and then your domain on the end, with
some code in between, then your site is being redirected. Sometimes they use an
ID number such as ID=4125 instead of the url to your website and then their
program will attribute that number to your URL so if you see ID in the url click
on it and see what happens. It may move so fast you can't see it, in which case
you need to check a server header checker (explained below).
Here is an example of one of these redirected URL's. The code before and after
your URL will contain various forms of redirecting it (bogus urls are being used
below with http removed so this page validates):
HijackersWebSiteURLgoeshere/id-codecausingRedirect goes here.?site=
www.YourWebSiteURLGoesHere.com
Hijacking Example 2 with Meta Refresh
Sometimes the URL will look innocent but will go to the dishonest site and there
will be code on that site that will redirect to your site with a Meta Refresh
Tag (automatically redirecting the browser to your site).
The Meta Refresh is a
favorite of spammers so search engines are banning sites using them. To see if a
site is using a Meta Refresh, view the code by clicking on view/source in your
browser menu and see if there are any meta refresh tags in the code at the top
of that page. Look for a meta redirect tag set for "0" seconds, that is
redirecting to your site, similar to the following:
meta http-equiv="refresh" content="0"; url=http://www.YourOwnDomainNameHere
However there are ways of hiding a redirect so that the general viewer can't see
it, as follows:
Hijacking Example 3 with a Server Side 302 Redirect in .htaccess
A hijacker may also use a Server Side 302 or set up 302 Redirects in an .htaccess
file telling the server to redirect to your site. 302 redirects tell the search
engines their site, or page, has moved temporarily to your site and to credit
the content of your site to their site and thus stealing your PR. Many
directories use 302 redirects on the links in their directory to track clicks,
however it results in the same problem, because Google is attributing those
links to your site and stealing your PR. You can't tell they are using 302
redirects by just viewing the URL, you need to copy the link into a server
header checker. If the results show they are using 302 redirects then the
directory may be stealing your page rank. If it shows a 200, then the page is
probably OK (if this search produces an error make sure there are no breaks in
the link).
One way to prevent unknowingly submitting to a site like this is to ALWAYS check
out a directory's links with a server header checker before submitting your link
to their site or it may cause your site irreparable harm instead of helping your
page rank. See Directories to Avoid for more information.
See message #54 in the following Webmaster World's Discussion forum for a very
clear discussion on how the search engines treat 302 redirects and why they harm
your site in BEWARE: Your site is at risk from hijackers.
Google is trying to change it's algorithym to prevent this as of April 2005
after a couple years of webmasters trying to bring this to Google's attention.
For more info read Google's 302 Redirect Problem Hijacking Example 4 with rel="no
follow" in the Link
A dishonest site that has agreed to trade links with you that has a desire to
lessen outgoing links on their site (to boost their own PR) will sometimes place
a rel="nofollow" in the link itself. This prevents search engines from following
that link. So while it appears that site has linked to your site the search
engines won't benefit your site for the PR it could have gained so check all
reciprocated links carefully for that little bit of code (run your mouse over
the link and check it in the bottom of your browser window).
Hijacking Example 5 - Your Site Captured in a Frame
Another method that dishonest webmasters use to benefit their own site and
provide no benefit to your own site is to allow you to submit your site but then
they install a code that draws your whole web page (including images and working
links) into a frame so your whole web page is displayed on their site. This is
dishonest because you think they are going to link to your site but what they
are actually doing is using your design and content and displaying it as their
own without your permission. This also steals traffic from your site because
people often see what they wanted on the hijacker's web site without even
visiting your web site.
You also get no benefit of the PR from that link because the link is inside a
frame on their web site which most search engines can't read but for those
search engines that can read what is inside frames your site may be penalized
for duplicate content (this can result in "Supplemental Results" being tagged on
the end of your listing in the search engines). Following is a sample of this
kind of url (http was removed and bogus URLs also removed so this page will
validate):
HijackersWebSiteURLgoeshere/opensite.cfm?site=
www.YourWebSiteURLGoesHere.comandYourIDnumbergoes hereID=____, etc.
This recently happened to one of my web pages that I had updated which resulted
in being #1 in Google for the main keywords and within 2 days this page appeared
on someone else's web site inside of a frame. I found proof of this in my site
meter's referral URLs and quickly set up a "pop out of frame" script for that
page and many others on my site and wrote the owner of the site to remove the
link.
Here is a site that lists several different break out of frames scripts. Be sure
and check to see if the one you choose works on all browsers. Following is the
script I install on pages captured in frames (not mentioned in the above site)
because it's the only one I've found that works on a Mac as well as a PC:
<script type="text/javascript">
if(top!= self) top.location.href = self.location.href
</script>
Hijacking Example 6
Your Business Name or Title and URL in their Title
Often directories, now called Scraper Directories (that you may have submitted
to yourself) will take your web page (if it's ranking well in the search engines)
and set up a separate web page, often called "more info" or "details" with your
business name in their title and/or your URL in their title and also your most
important text on your page that brings keyword rank to your site (sometimes
they repeat the title, description and keywords several times and also in alt
tags in the code so their page out ranks yours).
This is blatant content theft because it not only results in them competing with
your site for your business name or URL in search engine results, i.e., stealing
your rank, but they also often put a link to your site with a 302 redirect from
a scraper directory, often fed by DMOZ which also steals your PR.
These sites usually have Google AdSense ads on them and if so report them as an
Google AdSence Policy Violation because it's against their rules.
Hijacking Example 7 - Bad Links causing a Split Domain
If you have submitted your site to search engines as www.YourDomain.com and
somone links to your site with just YourDomain.com, i.e., without the WWW in
front, Google will think you have two sites under the same domain and credit you
with a duplicate content penalty (Supplemental Results). This is known as
Splitting your Domain. It can take months to recover from this after the fact so
best to prevent it by doing the following:
• Put a base href tag with the full address of that page, on every page on your
site
• Set up a 301 redirect in your .htaccess file. so all traffic to
YourOwnDomain.com will go to www.YourOwndomain.com or whichever one has the most
PR.
• Change all relative URLS on your site to full URLS (include the full address
on all internal links).
Hijackers are even starting to link to sites with a http/, i.e., they left out
the colon and two slashes or with a www.domain.com . with a space on the end.
The space will show up in your site: command search as www.domain.com%20. So
check every link coming into your site carefully for other new techniques
designed to put you out of business.
Hijacking Example 8 with Tracker2.php
Look for a URL similar to the following (this url was broken in two parts after
the (?) as it pushed the text beyond the borders of this page):
www.Hijacker'sDomainName.com/tracker2.php?
url=http://www.YourOwnDomainName.comHere/YourOwnPageURLHere.html
The tracker2.php? in the URL above is the culprit here. It is a click tracking
script often used by affiliate sites to track clicks. If anyone clicks on that
link it will first go to the offenders page and then quickly revert to your own
page. However, this script often uses a 302 redirect which causes Google to
think your page has been temporarily moved to the other site and it gives the PR
to that site, thus increasing their rank and reducing yours. If it is your home
page that was affected it is a very serious matter because the home page PR
provides rank for the rest of your website (Google started removing the PHP
tracker links in the site command in early 2005 so this is less of a problem
than it was earlier).
A 302 Redirect Could be a Google Bug
Some of the above examples have been the result of a Google bug and not
necessarily deliberate attempts to hijack your site or your PR, because Google
is following these redirects and attributing the resulting PR to the offending
site and then penalizing your site for duplicate content.
A very good step-by-step explanation of what happens with one of these
redirected URLs can be found in Webmaster World's discussion on this matter in
the Your Site is at risk from Hijackers thread. See post # 157 on page 11 of
this thread for a very good explanation of other steps to take not listed here..
Google Bug via shared IP Address or Shared Hosting
Some of these Google bugs are a result of 2 sites who are both on the same
shared IP address, i.e., one site sets up a 302 redirecting a page on their site
to another page on their site and your site is affected because it has the same
IP address and Google thinks your site's content has moved to the other site.
Some times Google will list the other sites Title in your title if it's on the
same IP address.
This can easily be changed by getting a dedicated IP address (usually only $1.00
more a month on a good host). Don't confuse this with a dedicated server which
is hundreds of dollars more per month.
Cómo obtener billones de páginas
indexadas en Google
Archivado por Armonth
el 18 de Junio del 2006 (12:55)
Traducción del original
Step-by-Step: How to Get BILLIONS of Pages Indexed by Google.
NdT: Por mantener el sentido original usamos el “billón” anglosajón
que son 1000 millones, cuando se lea 5 billones no son 5 millones de
millones si no 5.000 millones. Mi opinión sobre esta “práctica” la
tenéis en forma de comentario.
Como muchos SEOs saben, MSN ama los subdominios. Puedes crear cientos
de subdominios con palabras claves y MSN tendrá en alta estima estas
páginas. Lo mismo pasa con blogspot y otros blogs - lo hacen muy bien en
MSN y a veces en Yahoo. Ahora Google y el nuevo BigDaddy crawler está
demostrando tener preferencias aún más estúpidas a la hora de indexar y
calcular el valor de los subdominios.
Fíjate en éste sitio:
site:eiqz2q.org
- dependiendo del datacenter que te toque podrás ver entre 3.8 y
5.5 BILLONES de resultados. Y lo que es peor… el dominio tiene
tan sólo 18 días de vida. Así es, en menos de 3 semanas
una persona se las ha ingeniado para conseguir un dominio con 5 billones
de páginas indexadas en Google. Encima también entran en el ranking. Este
dominio en particular tiene un
ranking en Alexa por debajo de 7.000.
Otro dominio, propiedad de la misma persona, t1ps2see.com, tiene entre
1.7 y 2.4 billones de páginas indexadas y un ranking en Alexa
por debajo de los 2000… tras 4 semanas. Casualmente, ambos sitios
tienen 3 bloques de publicidad de Adsense en cada página. Me pregunto
cuanto puede ganar una persona diariamente con billones y billones de
páginas indexadas y con su ranking.

Inspirado por su trabajo, presento la guía Paso-a-Paso para obtener
billones de páginas indexadas en Google:
- Registra un dominio sin sentido que consista en números,
letras y símbolos secretos. ¡Montones!, registra cientos de
ellos.
- Configura un servidor para administrar todos los dominios y
subdominios. Es necesario que sea potente para soportar mucho
tráfico en unos pocos días.
- Compra tantas bases de datos de artículos como puedas.
La temática no importa. Debes buscar y reemplazar varios caracteres por
su correspondiente código ASCII para ayudar a evitar contenido
duplicado.
- Crea o compra un script común para ir tirando.
Necesitas responder con diferentes artículos basándote en qué palabra
clave se usa, sirviendo nuevo contenido eficazmente por cada subdominio.
Debes responder a cualquier petición hacia un subdominio. Tu servidor
debe estar configurado para permitir redirigir a tu página principal:
aquí tu script debe ordenar que contenido se muestra. Permitir crear un
infinito número de subdominios con contenido único. Ahora el truco de
este chico implica en usar subdominios de subdominios. Creas un
subdominio “temático” tipo music.3hid9gw.org y luego en el creas páginas
adicionales en forma de sub-subdominios, como: 2152.music.3hid9gw.org.
Dado que cada dominio y subdominio es considerado como un nuevo sitio
por Google, puedes saltarte la demora de “1 página indexada por sitio”
para nuevos dominios. Si no puedes afrontar está parte, contrata a
alguien… según Alexa traceback, parece ser que Argentina tiene
las personas adecuadas para el trabajo.
- Lanza tu ataque de comentarios spam hacía blogs.
Enlaza a unos cuantos de tus subdominios que estén enlazados entre sí.
- Espera unas pocas semanas… y luego uno sólo debe sentarse a
disfrutar tus billones de páginas indexadas. No te olvides de
poner 3 Adsense o bloques YPN en cada página.
More Info. on Website PR Hijacking
Spammers Hijack Web Site Listings in Google
Affiliate Commision Hijacking Alert
Dupe content checker - 302's - Page Jacking - Meta Refreshes
Webmaster World's Forum, Google News, discussing these hijackings.
Anti-Comment-Spam Tag Exploits. Set up Recip-checkers to look for rel=nofollow?
Lost in Google - No Title, No Description for your site as a result of 302
redirects, etc and what you can do about it.
Xencraft has a very good article on Preventing Web Site Hijacking.
Millions of Pages Google Hijacked via Open Directory feed

2
Big Black Hat SEO
by
http://bigblackhat.wordpress.com/tag/google/
Spam report: xxx.com
Lunes 12 de Junio de 2006
Este nos lo enviaron la semana pasada. Uno de los portales mejor posicionados a
la hora de búsquedas inmobiliarias por búsquedas como:
Pisos en Barcelona
Pisos en Valencia
Pisos en Sevilla
Lo que más llama la atención es el abuso del marquee, de los <h1> y la densidad
de ciertas palabras (Tipos de Inmueble, provincias y poblaciones).
Podéis encontrar toda la información sobre este spam en este enlace:
http://www.inmoblog.com/index.php/portales-inmobiliarios/ganar-posiciones-en-google-a-toda-costa/
Spam report: xx Hoteles - Cloaking
Miércoles 7 de Junio de 2006
Una aportación que nos han enviado gracias a la anotación que nos han hecho en
xxxx:
En la antigua empresa en la que trabajaba xxxxxxxxxxxxxx también hacen trampas y de las gordas…
Muy bien posicionados por palabras como "hoteles":
http://www.google.es/search?hl=es&q=hoteles
Claro! si miramos la caché de google (hay que hacer stop antes de que
redireccione a la portada de xx) veremos que utilizan una de las técnicas más
penalizadas de Google… Cloaking
Caché de Google de la portada de xx Hoteles
Este es el contenido oculto que tiene dicha página y que Google indexó:
<noscript>
<body>
<h1>
<p><strong>Reserva <b style="color:black;background-color:#ffff66">hoteles</b>,
ofertas alojamientos Madrid, Barcelona, Marbella - NH</strong> </h1>
</p>
<p> </p>
<p> </p>
<p> </p>
<p> </p>
<p><b style="color:black;background-color:#ffff66">Hoteles</b> reserva,
ofertas alojamientos Madrid, Barcelona, Marbella, Valencia con NH Hotels:
tu alojamiento en Canarias, Bilbao, Zaragoza, Malaga, Europa o Iberoamerica.
Seleccion de alojamiento disponible por localidades y destino seleccionado.
Localizacion, informacion detallada por hotel y sistema de reservas en linea.
¿Quiere saber mas sobre nuestras <strong>ofertas de alojamientos</strong>? </p>
<H1><a href="http://www.nh-hotels.com/site/esp/hoteles-madrid-1280.htm">Oferta
<b style="color:black;background-color:#ffff66">hoteles</b> y alojamientos
Madrid</a></H1>
<H1><a href="http://www.nh-hotels.com/site/esp/hoteles-sevilla-1410.htm">
<b style="color:black;background-color:#ffff66">Hoteles</b> Sevilla</a></H1>
<H1><a href="http://www.nh-hotels.com/site/esp/hoteles-granada-1180.htm">
<b style="color:black;background-color:#ffff66">Hoteles</b> Granada</a></H1>
<H1><a href="http://www.nh-hotels.com/site/esp/hoteles-barcelona-1080.htm">
Oferta <b style="color:black;background-color:#ffff66">hoteles</b> y
alojamientos Barcelona</a></H1>
<H1><a href="http://www.nh-hotels.com/site/esp/hoteles-canarias-1350.htm">
<b style="color:black;background-color:#ffff66">Hoteles</b> - Hotel
Canarias</a></H1>
<H1><a href="http://www.nh-hotels.com/site/esp/hoteles-malaga-1290.htm">
<b style="color:black;background-color:#ffff66">Hoteles</b> Malaga</a></H1>
<H1><a href="http://www.nh-hotels.com/site/esp/hoteles-pamplona-1310.htm">
<b style="color:black;background-color:#ffff66">Hoteles</b> Pamplona</a></H1>
<H1><a href="http://www.nh-hotels.com/site/esp/index.htm">Ofertas alojamientos
en Español</a></H1>
<H1><a href="http://www.nh-hotels.com/site/ale/index.htm">NH en Aleman</a></H1>
<H1><a href="http://www.nh-hotels.com/site/belg/index.htm">Reserva
<b style="color:black;background-color:#ffff66">Hoteles</b> en Belgica</a></H1>
<H1><a href="http://www.nh-hotels.com/site/hol/index.htm">
Alojamiento en Holanda</a></H1><H1><a href="http://www.nh-hotels.com/site/int/index.htm">Alojamientos
NH - ingles</a></H1>
<H1><a href="http://www.nh-hotels.com/site/merc/index.htm">
Ofertas Mercosur</a></H1>
<H1><a href="http://www.nh-hotels.com/site/uk/index.htm">NH - UK</a></H1>
<H1><a href="http://www.nhhotelesdirectorio.com">Directorio de <b style="color:black;background-color:#ffff66">Hoteles</b>
NH</a></H1>
<H1><a href="http://www.nh-hotels.com/listapaises/sp/europa.html"><b style="color:black;background-color:#ffff66">Hoteles</b>
Europa NH - SP</a></H1>
<H1><a href="http://www.nh-hotels.com/listapaises/sp/america.html"><b style="color:black;background-color:#ffff66">Hoteles</b>
America NH - SP</a></H1>
<H1><a href="http://www.nh-hotels.com/listapaises/sp/africa.html"><b style="color:black;background-color:#ffff66">Hoteles</b>
Africa NH - SP</a></H1>
<H1><a href="http://www.nh-hotels.com/listapaises/en/europe.html">Hotels Europe
NH - EN</a></H1>
<H1><a href="http://www.nh-hotels.com/listapaises/en/america.html">Hotels
America NH - EN</a></H1>
<H1><a href="http://www.nh-hotels.com/listapaises/en/africa.html">Hotels Africa
NH - EN</a></H1>
<H1><a href="http://www.nh-hotels.com/listapaises/nl/europe.html">Hotels Europe
NH - NL</a></H1>
<H1><a href="http://www.nh-hotels.com/listapaises/nl/america.html">Hotels
America NH - NL</a></H1>
<H1><a href="http://www.nh-hotels.com/listapaises/nl/africa.html">Hotels Africa
NH - NL</a></H1>
<H1><a href="http://www.nh-hotels.com/listapaises/de/europe.html">Hotels Europe
NH - DE</a></H1>
<H1><a href="http://www.nh-hotels.com/listapaises/de/america.html">Hotels
America NH - DE</a></H1>
<H1><a href="http://www.nh-hotels.com/listapaises/de/africa.html">Hotels Africa
NH - DE</a></H1>
</body>
</noscript>
Spam Report: xxx.com
Viernes 2 de Junio de 2006
El primero que nos manda un colaborador… animense
sólo 2 cosas nos bastan, entren en la home de xxx.com y fijense en la
linea que recorre de derecha izquierda con palabras clave como "pisos madrid,
"pisos barcelona", pisos valencia", "pisos málaga"… enlazando a lo que debe ser
su "otro" portal inmobiliario tablondepisos.com (Estos al contrario tienen la
linea de enlaces con xxxx en el pie de la página )
Para continuar con los mapas web, esta es una de las especialidades de los
spammers… simples (texto plano), y con el anchoring que les interesa posicionar,
les da igual la densidad de palabras clave:
http://www.globaliza.com/enlaces.html
http://www.globaliza.com/enlacesAlquiler.html
Por si acaso los borran cuando alquien lea este post lo hemos enlazado a la
caché de Google.
Que cara tienen algunos, ya ni diseño…
Publicado en Google | 5 Comentarios »
Spam Report: xxx.es
Jueves 1 de Junio de 2006
¿Cómo es posible posicionar una web siempre en los primeros luegares para
búsquedas así?:
vuelos madrid barcelona
vuelos madrid canarias
vuelos barcelona estambul
pues ahí tenemos el ejemplo de xxx:
Primero cogemos y creamos todos los subdominios posibles de las ciudades,
países, zonas de interés, compañías aéreas… que tengamos en la base de datos.Con
hacer una búsqueda: “site:xxx.es” en Google lo podéis ver:
escandinavia.edreams.es
fuerteventura.edreams.es
cadiz.edreams.es
vitoria.edreams.es
dusseldorf.edreams.es
marruecos.edreams.es
lufthansa.edreams.es
….
todas las páginas tienen el mismo contenido salvo variaciones en el título, en
los <h1> principales y en los campos del formulario. Vemos lufthansa.xxx.es:
* llenamos la página de enlaces a páginas de vuelos, hoteles y viajes aumentando
la densidad de palabras clave como “vuelos“, “ofertas“, “hoteles” (usado para
mejorar el anchoring por esa búsqueda…)
* Aparte incluimos un montón de enlaces de rutas de ciudades (como “Madrid -
Barcelona“) que no tienen nada que ver con el título de la página (no son rutas
de lufthansa).
¿Qué conseguimos con ésto?
Pues 442 enlaces con el anchoring “Madrid Barcelona” desde el propio sitio a la
página de vuelos Madrid Barcelona. Lo suficiente para hacer aparecerle en primer
lugar por esa búsqueda…
Spam Report: xxx.es
Lunes 22 de Mayo de 2006
Increible lo de esta gente, explíquenme como puede ser que la portada de
Autoscout en España esté en los primeros lugares por búsquedas en Google como
“coches de ocasión”, “vehículos de ocasión”, “coches usados”. No tiene contenido
ninguno referente!!! no es navegable por buscadores, todo formularios…
Quieren la explicación?? aquí la tienen:
www.auto-ocasion24.com
www.auto-oferta24.com
www.autoocasion24.com
www.autoscout24.ws
www.buscacoche24.com
www.clasificados-auto.com
www.clasificados24.com
www.clasificadosmotor.com
www.coche24.com
www.coche24.net
www.coches24.com
www.coches24.net
www.cochesusados24.com
www.mundomotor24.com
www.segundamano24.com
www.todoauto24.com
www.tucoche24.com
www.vehiculos-ocasion24.com
www.vehiculosdeocasion24.com
Sí, se han registrado un montón de dominios relacionados con el tema, han
replicado una página con un poco de contenido y la han llenado de enlaces
directos a autoscout24.es , eso sí con un anchoring bueno y desde un referer
también de contenido relacionado…
3
Big Black Hat SEO
Viene de lejos el problema de las redirecciones, pero últimamente decenas de
webs con cierta importancia han tenido que padecer estos "ataques".
En diversos foros anglosajones se ha reavivado esta vieja polémica, y se hacen
llamamientos a Google para que corrija este "bug" que presuntamente contiene.
Resumiendo el tema:
Como funciona:
Google trata los meta-refresh como redireccionamientos 302. El efecto de esta
redirección es que Googlebot indexa la página que contiene el 302 con el
contenido de la página a la cual ha apuntado la redirección.
Consecuencias:
El filtro de contenido duplicado de Google en estos casos se encontrará dos
páginas con el mismo contenido y la página "secuestrada" (hijacked) es sacada de
las Serps. Si la página tiene PR, este pasará también a manos del
"secuestrador".
Detección:
Modo 1:
Usando Linux podemos introducir:
lynx -mime_header URLsecuestrador
Incluyendo "http..." Lynx mostrará las cabeceras HTTP, de modo que podrás saber
si es un meta-refresh, un 301(inocuo) o un 302.
Modo 2:
Busca tu dominio. Si encuentras un enlace en las SERPs que muestra el mismo
título que tu web, podrías estar siendo "secuestrado".
Si clickas ese enlace y te lleva a tu web, es probable que tu web sufra este
problema.
Si buscas los enlaces del atacante verás que son los tuyos.
¿Qué gana el atacante?:
Pensemos que aún y todo cuando alguien clicke en la web del secuestrador, el
visitante será reenviado a tu web. Entonces, ¿Que gana?
Pues puede utilizar la técnica para dañar a un competidor al hacer caer la web
original en las SERPS. También, y más probable, puede beneficiarse de los
backlinks que la posición que te robó pueda reportarle y además puede cambiar
cuando quiera el meta refresh (o el 302) y redirigirlo hacia una de sus propias
webs.
Además si Google cae en la trampa e identifica la web del "atacante" como la
original, se llevará consigo el PR de la web atacada.
Como evitarlo:
Ahora mismo no existe una cura infalible para este "ataque". Hay veces que el
problema lo provocamos nosotros mismos al introducir nuestro enlace en
directorios que usan este tipo de redirecciones.
Si el problema es grave se podría acudir al hosting del atacante aduciendo temas
de copyrights (que te atiendan es otro problema).
Conclusiones:
El problema viene de lejos, y no siempre el "atacante" es consciente de que está
dañando a la página que linkea. Muchos programas de enlaces (trackers) utilizan
diferentes redireccionamientos que pueden eventualmente causar los problemas
antes mencionados.
Por ahora Google no ha corregido el "bug", aún teniendo conocimiento del mismo
desde hace meses, pero dada la difusión que se está dando al tema puede que
pronto encuentre una solución.
Gracias.
I THINK
GOOGLE.COM
|