Pasiune de chinez bătrân

Ghiciţi ce am făcut ieri toată ziua (chestie retorică). Am modificat un singur fişier, mai precisi o singură linie din fişierul ce asigură buna funcţionare a blogului (.htaccess). Toată ziua.

Nu era nimic cu defect vizibil, dar pentru mine era ceva critic. În acest moment Google a indexat 12,700 de pagini pe blogul meu. Dublu decât am! Şi, investigând problema, am văzut că sunt un fel de SEO sammer nenorocit, pentru că multe pagini erau indexate aiurea, de pe nişte link-uri (URL-uri pentru corectitudine) oribile.

Să vă explic. Se dă pagina care este validă:

http://www.robintel.ro/index.php/blog/fun/ironie-fin.html

Şi clonele ei:

http://www.robintel.ro/tech/personal/index.php/blog/fun/ironie-fin.html

http://www.robintel.ro/personal/opinii/index.php/blog/fun/ironie-fin.html

http://www.robintel.ro/revelatii/diverse/index.php/blog/fun/ironie-fin.html

Pentru că partea cu /index.php/blog/fun/ironie-fin.html este validă, articolul era afişat, numai că în timp puteam ajunge în situaţia, ipotetică ce-i drept, de a avea un număr de pagini indexate egal cu pătratul numărului articolelor, sau ceva de genul acesta. Nici cei mai mari SEO spammeri nu ar şti să facă de-astea. Oribil. Google taxează conţinutul dublu iar eu nu vreau să mă ţin de prostii.

Ştiţi că am spus că am o preblemă cu blogul, ei bine asta era. Acum am rezolvat-o, după ce m-am chinuit cu ea câteva zile, dar în special ieri, până la trei dimineaţa. Iată, deci, ce am modificat ieri toată ziua:

RewriteRule ^[^/]+/[^/]+/[^/]+/index.php/([^/]+/[^/]+/[^.]\.html)$ http://www.example.com/index.php/$1 [R=301,L]

Pentru asta m-am chinuit eu zile în şir! Să modific o singură linie (s-ar putea să fie afişată pe două linii, dar în fişier este o singură linie), într-un singur fişier.

Pentru tech junkies: codul pare a da un redirect 301 (pagina s-a mutat) către o pagină cu un URL corect, dar, în realitate, acesta nu există fiindcă index.php se execută după .htaccess, deci  generează un 404 (pagna nu a fost găsită).

Şi am mutat şi pozele postate pe blog anul trecut, din poziţia:

http://www.robintel.ro/images/stories/gallery/public/blog/luna-2008/…

În poziţia:

http://www.robintel.ro/images/stories/gallery/public/blog/2008/luna/…

Se observă că acum le-am pus mai ordonat. Să-mi fie învăţătură de minte. Din fericire n-a fost nevoie decât de mutarea fişierelor prin FTP (chestie de câteva secunde), de redenumirea corespunzătoare a folderelor şi de executarea unor comenzi de SQL (baza de date):

UPDATE `jos_content` SET `introtext` = REPLACE(`introtext`, ‘luna-2008’, ‘2008/luna’)

Tot cu acest cod am eliminat şi sursa link-urilor invalide, cu care m-am luptat mai sus. Acum sunt rupt de oboseală şi aştept să curgă erorile, că la ce bălării a indexat Google pe acolo…

9 Comentarii

  1. Lirca 31 martie 2009 la 07:47 - Raspunde

    dude, tu ce specializare ai? io nu inteleg nimic din ce ai scris…

    • Robin Molnar 31 martie 2009 la 08:04 - Raspunde

      :woohoo: Aia cu .htaccess nici eu n-am ştiut-o, aşa că am întrebat. :woohoo: Linia
      [quote]RewriteRule ^[^/]+/[^/]+/[^/]+/index.php/([^/]+/[^/]+/[^.].html)$ http://www.example.com/index.php/$1 [R=301,L][/quote]spune că dacă am o cerere de forma:
      [quote][u]http://www.robintel.ro/[/u][b]ceva/altceva[/b][u]/index.php/secţiune/categorie/articol.html[/u][/quote]atunci să piardă acel segment [quote][b]ceva/altceva[/b][/quote] dinainte de [quote][b]/index.php/[/b][/quote] prin redirecţionarea către ultima parte din URL [quote][b]/index.php/secţiune/categorie/articol.html[/b][/quote] fără alte bălării. :woohoo:

      Linia [quote]UPDATE `jos_content` SET `introtext` = REPLACE(`introtext`, ‘luna-2008’, ‘2008/luna’)[/quote] spune aşa: actualizează din tabelul [b]jos_content[/b], coloana [b]introtext[/b] în toate locurile unde apare şirul de caractere [b]luna-2008[/b] din ceea ce este în [b]2008/luna[/b].

      Sper că te-am lămurit. 😉

      • Robin Molnar 31 martie 2009 la 08:07 - Raspunde

        😀 Da, îmi răspund mie însumi: pfuai ce comentariu mişto! 😀 Numa’ râme p-acolo! :woohoo:

  2. Lirca 31 martie 2009 la 08:02 - Raspunde

    da..clar…las ca daca o sa am probleme de genu’ o sa stiu la cine sa apelez 🙂

  3. Mihai Todor 31 martie 2009 la 10:46 - Raspunde

    Eh, asa ajunge un om normal la cap a isi sparga creierii facand ciolanii prin Apache in loc sa faca treaba direct din php 😛

    Ma rog, presupun ca nu vrei tu sa te apuci sa iti customizezi pachetele de Joomla 😛

    PS: Cand scoate si Joomla suport pentru UTF8 la linkuri? 😀

    • Robin Molnar 31 martie 2009 la 15:48 - Raspunde

      :woohoo: Nu vreau să o fac cu un redirect de de Java sau PHP pentru că e mai elegant să o faci din .htaccess. Sunt un profesionist, la urma urmei. 😆

  4. cipoc 31 martie 2009 la 12:57 - Raspunde

    tu de ce te chinui asa tare?:))

    • Robin Molnar 31 martie 2009 la 15:49 - Raspunde

      :woohoo: Pentru că nu vreau să fac spam SEO. :woohoo: Etică, chestii… :woohoo:

Lasa un raspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

Vreau să fiu părtaș la faptă. Poți, de asemenea, să fii părtaș și fără martori.

Acest site folosește Akismet pentru a reduce spamul. Află cum sunt procesate datele comentariilor tale.