DI NELLO COPPETO (NeCoSi)

Riassunto delle puntate precedenti

Durante la giornata in cui è stato rilasciato il browser Google Chrome
, sul sito GeekPlace.org ho pubblicato un articolo molto strano intitolato Google Chrome Download che parlava circa una storia di dubbio gusto e che nulla centrava con il vero Google Chrome. Moltissime persone erano in attesa di poter provare il nuovo browser e per questo ricercavano agitati in tutto il web manco fosse una caccia al tesoro. La pagina in questione ha registrato in brevissimo tempo più di 1000 visite e alcuni commenti di spiccata perspicacia. Nel post successivo ho provato a spiegare cosa stava succedendo, ma ovviamente le persone interessate ad approfondire si sono dimostrate essere solo 1/10 di quelle iniziali.

Seo

Il problema è nato quando ho cercato di trovare un metodo per poter ingannare Google. Ingannare Google per i meno perspicaci significa reindirizzare grandi quantità di utenti sui propri siti, su cui magari è presente tanta pubblicità con cui poter guadagnare molti soldi, per poi spenderli come ci rende più felici. :)

La mia intenzione era quella di creare pagine ad hoc per i motori di ricerca, disinteressandomi completamente dei contenuti. In una prima fase di sviluppo ho pensato subito ad un tool che creasse documenti di testo usando parole prese a caso da una lista di parole generica. Poi ad ogni tot parole casuali avrei potuto inserire le parole chiavi che mi interessava far indicizzare. E fin qui tutto era molto semplice e banale. Poi ho pensato al risultato che sarebbe stato qualcosa di simile: “cerca contro necosi un corrente sempre andare è sbattere realtà pazzo muso il poter di la il per”

Sulla base di questo risultato ho capito che una soluzione di questo genere non avrebbe avuto lunga vita, gli utenti avrebbero messo psicologicamente questi siti senza senso nella loro blacklist celebrale. I motori di ricerca avrebbero potuto sviluppare (se ancora non lo hanno fatto) un tool dedicato all’analisi grammaticale del testo per poter escludere i testi senza senso o comunque avrebbero potuto declassare i testi con dubbia accessibilità (scritti in dialetto, etc.).

Ho iniziato a percorrere nuove strade, e mi sono imbattuto in una soluzione più articolata e molto più performante. Questa soluzione si chiama Polygen.

Polygen

Il Polygen è un programma che genera frasi casuali secondo una definizione grammaticale, ovvero seguendo un corpus programmabile di regole sintattiche e lessicali.
Formalmente è un interprete di un metalinguaggio che permette di definire linguaggi.
Interpretare, in generale, significa eseguire un programma ed infine riportarne il risultato; nel caso del Polygen il programma è una grammatica sorgente, l’esecuzione consiste nell’esplorazione di tale grammatica lungo un percorso casuale ed il risultato consiste in una frase. “
[da polygen.org]

Per coloro che in università hanno preparato l’esame di linguaggi di programmazione, programmare in Polygen sarà una passeggiata.

Dopo una lettura rapida del Manuale ho iniziato a scrivere una grammatica per un mio cliente, ed oggi siamo quasi pronti a poter generare a basso costo ed in tempi brevissimi contenuti di senso compiuto e ti notevole interesse. A dire il vero alcuni risultati sono anche molto divertenti e quindi molto letti e linkati!!!

Per gli sviluppatori c’è da sottolineare che i sorgenti di Polygen sono disponibili e che il copyright è di Alvise Spanò, che gentilmente ha deciso di rilasciare il codice con la licenza libera per eccellenza: la Gnu/GPL.

Polygen + Seo = Uno scenario inquietante

Quindi sfruttando grammatiche ad hoc riesco a scrivere contenuti originali, di lunghezza variabile, ma soprattutto testi di senso compiuto che approfondiscono sempre di più lo stesso argomento. Google vede che ogni giorno sul mio sito pubblico contenuti originali, ad esempio riguardo Google Chrome, ed indicizza tutto ciò che una macchina casuale è in grado di produrre, cioè una mole impressionante di dati. Polygen produce e Google ingoia senza scoppiare, fino al punto che gli utenti prima o poi si ritroveranno a documentarsi su FAQ finte, leggeranno news false, discuterenno in forum popolati da programmi “intelligenti” e poi sorridendo affideranno i loro figli alla sempre sorridente tata-robot :)

NB: questo testo è stato scritto con PolyGen

Buona giornata, ci vediamo nel futuro.

___________________________________

Per approfondire, vi consigliamo la lettura di:

http://zapping87.spaces.live.com/blog/cns!6F1E699B5548381F!275.entry

http://thetechnocratishere.blogspot.com/2008/07/generare-frasi-e-farle-pronunciare-al.html

http://i-men.blogspot.com/2008/02/polygen-favola-ovvero-la-storia.html

http://soulplace.wordpress.com/2007/11/26/i-love-polygen/___

La lezione di Oilproject che ti suggeriamo oggi è Guida PHP: Condizioni e Operatori logici.