Scoperta e Validazione delle fonti

Una delle fasi più importanti di un qualsiasi progetto che si propone l’osservazione e l’analisi dei contenuti informativi (in forma testuale) generati dai network, è sicuramente la scelta delle fonti. Si osserva che a tal proposito risulta immediatamente inefficiente una selezione manuale delle fonti effettuata tramite l’uso di keyword sui motori di ricerca oppure, ad esempio, “navigando” nelle strutture tematiche proposte da altre risorse (Xanga, Alexa, Technorati, ecc.). Usare questi metodi significa esporsi ad un certo numero di criticità tra le quali: il rischio di catalogazione di un numero eccessivo di fonti – con relativi fenomeni negativi quali ridondanza o scarsa significatività dell’informazione (fonti troppo specialistiche o eccessivamente generali allontanano il “risultato atteso” da quello ottimale) fino al caso più grave – e più frequente nelle applicazioni reali – costituito dalla scelta delle sole fonti che godono di un miglior posizionamento nella classifica dei motori di ricerca. In questo ultimo caso infatti, la cernita verrebbe in realtà effettuata dai motori (e con parametri del tutto diversi dai requisiti del progetto) e non dall’operatore, che in sostanza non ha alcun controllo consapevole sui criteri attraverso i quali la scelta viene effettuata, ma bensì – cosa assai peggiore – ne ha l’illusione. Un metodo che da maggiori garanzie in tal senso, può essere quello che prevede l’impiego delle ontologie. Costruire una formalizzazione efficace del progetto stesso in tutte le sue componenti e relazioni (compreso il concetto di “fonte” e la sua ontologia) può aiutare l’analista nella fase di scoperta e validazione delle “sorgenti” di informazioni. Non è un controsenso fondare tutto il progetto sul concetto di “fonte”: cos’è infatti una fonte – ontologicamente parlando – se non una “informazione sulle possibilità (di informare) che una risorsa ha” ? Nell’intelligence l’imperativo è “identificare ed estrarre informazioni significative”; se anche la fonte è tipo particolare di informazione (“…io so [informazione] che quella specifica fonte [risorsa] può darmi informazioni su…”) allora è giusto procedere prima con la “identificazione ed scoperta” delle fonti. Per quanto concerne il progetto specifico – che si è deciso di considerare alla stregua di un problema di intelligence – l’intenzione è quella di tentarne una formalizzazione ontologica attraverso Protege. Una volta fatto ciò si procederà con la scoperta, il mining e la validazione delle fonti significative, dalle quali poi si attingerà tutto il materiale informativo indispensabile per le successive fasi del progetto.

Lascia un commento

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...

%d blogger cliccano Mi Piace per questo: