nib.com design texts - ARTICLE
Setaro Seologic
webmaster
13.01.15
Latent Semantic Indexing
L’indicizzazione semantica latente è un metodo finalizzato ad estrarre concetti da un documento o un insieme di documenti.
Ogni documento ed ogni termine è espresso da un vettore i cui elementi corrispondono a questi concetti. ogni elemento del vettore comunica il grado di partecipazione del documento o del termine ad un determinato concetto. Il punto, in questo contesto, non è quello di descrivere un concetto, ma di essere in grado di rappresentare documenti e termini in modo unificato. L’analisi semantica latente non si occupa di comprendere il significato di un documento o di un termine, al contrario essa serve a rispondere al meglio ad una determinata domanda, interrogazione o query: associando, in base al contesto, determinate parole (e quindi determinati documenti) a determinati concetti, essa scova delle relazioni semantiche che altrimenti rimarrebbero nascoste.
E’ importante capire che il punto non sta nell’avere una descrizione del concetto: LSI è un metodo di recupero di informazioni applicato all’analisi semantica che ha ben poco a che vedere con il passaggio al Web Semantico come immaginato dal W3C. Non parliamo infatti di un codifica attraverso dati: in quel caso abbiamo i vari microformati e microdati (Schema.org etc.) che però, attualmente, non rappresentano un fattore di ranking, almeno stando (e non abbiamo ragioni per diffidare) a quanto dice Searchmetrics . Il metodo di indicizzazione semantica latente è soltanto uno strumento che permette(rebbe) al Motore di Ricerca di orientarsi – in maniera “semantica” – all’interno di un web ancora fatto di documenti.
Questo strumento, ad oggi considerato uno dei più grandi “miti SEO” che ancora circolano nella comunità, quasi certamente non rappresenta un fattore di ranking: questo non vuol dire che i suoi principi non possano fungere da bussola per orientarsi all’interno dei meccanismi di copywriting, in particolar modo se si hanno velleità di SEO copywriting. I principi estratti dall’analisi dell’algoritmo LSI vanno incrociati con la riflessione fatta attorno ad un altro algoritmo, denominato LDA.
Per approfondire può essere molto utile la pagina di Wikipedia Inglese sull’argomento, che trovate qui
Ogni documento ed ogni termine è espresso da un vettore i cui elementi corrispondono a questi concetti. ogni elemento del vettore comunica il grado di partecipazione del documento o del termine ad un determinato concetto. Il punto, in questo contesto, non è quello di descrivere un concetto, ma di essere in grado di rappresentare documenti e termini in modo unificato. L’analisi semantica latente non si occupa di comprendere il significato di un documento o di un termine, al contrario essa serve a rispondere al meglio ad una determinata domanda, interrogazione o query: associando, in base al contesto, determinate parole (e quindi determinati documenti) a determinati concetti, essa scova delle relazioni semantiche che altrimenti rimarrebbero nascoste.
E’ importante capire che il punto non sta nell’avere una descrizione del concetto: LSI è un metodo di recupero di informazioni applicato all’analisi semantica che ha ben poco a che vedere con il passaggio al Web Semantico come immaginato dal W3C. Non parliamo infatti di un codifica attraverso dati: in quel caso abbiamo i vari microformati e microdati (Schema.org etc.) che però, attualmente, non rappresentano un fattore di ranking, almeno stando (e non abbiamo ragioni per diffidare) a quanto dice Searchmetrics . Il metodo di indicizzazione semantica latente è soltanto uno strumento che permette(rebbe) al Motore di Ricerca di orientarsi – in maniera “semantica” – all’interno di un web ancora fatto di documenti.
Questo strumento, ad oggi considerato uno dei più grandi “miti SEO” che ancora circolano nella comunità, quasi certamente non rappresenta un fattore di ranking: questo non vuol dire che i suoi principi non possano fungere da bussola per orientarsi all’interno dei meccanismi di copywriting, in particolar modo se si hanno velleità di SEO copywriting. I principi estratti dall’analisi dell’algoritmo LSI vanno incrociati con la riflessione fatta attorno ad un altro algoritmo, denominato LDA.
Per approfondire può essere molto utile la pagina di Wikipedia Inglese sull’argomento, che trovate qui