Pasiune de chinez bătrân
Ghiciţi ce am făcut ieri toată ziua (chestie retorică). Am modificat un singur fişier, mai precisi o singură linie din fişierul ce asigură buna funcţionare a blogului (.htaccess). Toată ziua.
Nu era nimic cu defect vizibil, dar pentru mine era ceva critic. În acest moment Google a indexat 12,700 de pagini pe blogul meu. Dublu decât am! Şi, investigând problema, am văzut că sunt un fel de SEO sammer nenorocit, pentru că multe pagini erau indexate aiurea, de pe nişte link-uri (URL-uri pentru corectitudine) oribile.
Să vă explic. Se dă pagina care este validă:
http://www.robintel.ro/index.php/blog/fun/ironie-fin.html
Şi clonele ei:
http://www.robintel.ro/tech/personal/index.php/blog/fun/ironie-fin.html
http://www.robintel.ro/personal/opinii/index.php/blog/fun/ironie-fin.html
…
http://www.robintel.ro/revelatii/diverse/index.php/blog/fun/ironie-fin.html
Pentru că partea cu /index.php/blog/fun/ironie-fin.html este validă, articolul era afişat, numai că în timp puteam ajunge în situaţia, ipotetică ce-i drept, de a avea un număr de pagini indexate egal cu pătratul numărului articolelor, sau ceva de genul acesta. Nici cei mai mari SEO spammeri nu ar şti să facă de-astea. Oribil. Google taxează conţinutul dublu iar eu nu vreau să mă ţin de prostii.
Ştiţi că am spus că am o preblemă cu blogul, ei bine asta era. Acum am rezolvat-o, după ce m-am chinuit cu ea câteva zile, dar în special ieri, până la trei dimineaţa. Iată, deci, ce am modificat ieri toată ziua:
RewriteRule ^[^/]+/[^/]+/[^/]+/index.php/([^/]+/[^/]+/[^.]\.html)$ http://www.example.com/index.php/$1 [R=301,L]
Pentru asta m-am chinuit eu zile în şir! Să modific o singură linie (s-ar putea să fie afişată pe două linii, dar în fişier este o singură linie), într-un singur fişier.
Pentru tech junkies: codul pare a da un redirect 301 (pagina s-a mutat) către o pagină cu un URL corect, dar, în realitate, acesta nu există fiindcă index.php se execută după .htaccess, deci generează un 404 (pagna nu a fost găsită).
Şi am mutat şi pozele postate pe blog anul trecut, din poziţia:
http://www.robintel.ro/images/stories/gallery/public/blog/luna-2008/…
În poziţia:
http://www.robintel.ro/images/stories/gallery/public/blog/2008/luna/…
Se observă că acum le-am pus mai ordonat. Să-mi fie învăţătură de minte. Din fericire n-a fost nevoie decât de mutarea fişierelor prin FTP (chestie de câteva secunde), de redenumirea corespunzătoare a folderelor şi de executarea unor comenzi de SQL (baza de date):
UPDATE `jos_content` SET `introtext` = REPLACE(`introtext`, ‘luna-2008’, ‘2008/luna’)
Tot cu acest cod am eliminat şi sursa link-urilor invalide, cu care m-am luptat mai sus. Acum sunt rupt de oboseală şi aştept să curgă erorile, că la ce bălării a indexat Google pe acolo…




dude, tu ce specializare ai? io nu inteleg nimic din ce ai scris…
:woohoo: Aia cu .htaccess nici eu n-am ştiut-o, aşa că am întrebat. :woohoo: Linia
[quote]RewriteRule ^[^/]+/[^/]+/[^/]+/index.php/([^/]+/[^/]+/[^.].html)$ http://www.example.com/index.php/$1 [R=301,L][/quote]spune că dacă am o cerere de forma:
[quote][u]http://www.robintel.ro/[/u][b]ceva/altceva[/b][u]/index.php/secţiune/categorie/articol.html[/u][/quote]atunci să piardă acel segment [quote][b]ceva/altceva[/b][/quote] dinainte de [quote][b]/index.php/[/b][/quote] prin redirecţionarea către ultima parte din URL [quote][b]/index.php/secţiune/categorie/articol.html[/b][/quote] fără alte bălării. :woohoo:
Linia [quote]UPDATE `jos_content` SET `introtext` = REPLACE(`introtext`, ‘luna-2008’, ‘2008/luna’)[/quote] spune aşa: actualizează din tabelul [b]jos_content[/b], coloana [b]introtext[/b] în toate locurile unde apare şirul de caractere [b]luna-2008[/b] din ceea ce este în [b]2008/luna[/b].
Sper că te-am lămurit. 😉
😀 Da, îmi răspund mie însumi: pfuai ce comentariu mişto! 😀 Numa’ râme p-acolo! :woohoo:
da..clar…las ca daca o sa am probleme de genu’ o sa stiu la cine sa apelez 🙂
😆 Oho câte mai am de învăţat… 😆
Eh, asa ajunge un om normal la cap a isi sparga creierii facand ciolanii prin Apache in loc sa faca treaba direct din php 😛
Ma rog, presupun ca nu vrei tu sa te apuci sa iti customizezi pachetele de Joomla 😛
PS: Cand scoate si Joomla suport pentru UTF8 la linkuri? 😀
:woohoo: Nu vreau să o fac cu un redirect de de Java sau PHP pentru că e mai elegant să o faci din .htaccess. Sunt un profesionist, la urma urmei. 😆
tu de ce te chinui asa tare?:))
:woohoo: Pentru că nu vreau să fac spam SEO. :woohoo: Etică, chestii… :woohoo: