ISISLab

Caricamento Eventi

« Tutti gli Eventi

  • Questo evento è passato.

“Outlier Detection” di Salvatore Santelia e “Syntactical errors detection and correction” Luca Postiglione

Settembre 11, 2019 @ 12:00 pm - 1:00 pm

Abstract del Seminario "Syntactical errors detection and correction" di Luca Postiglione:


Il mio lavoro si occupa di progettare e implementare una libreria per individuare e correggere errori sintattici all'interno di collezioni di stringhe omogenee (es. Regioni, Province o Comuni) utilizzando tecniche di clustering.
//Sono state portati avanti altre funzionalità, test e implementazioni rispetto allo scorso seminario, in base agli obiettivi individuati.
Al fine di verificare l'indipendenza dell'approccio proposto dalla lingua italiana, sono stati condotti dei test su dataset europei di diverse nazioni (es. Francia e Paesi Bassi). In questo seminario riporterò i risultati ottenuti e le difficoltà riscontrate.
Al fine di estendere la soluzione proposta di "Error Detection" presentata nello scorso seminario, presenterò la versione estesa del mio approccio, al fine di correggere errori sintattici.
Da un punto di vista implementativo, discuterò dell'implementazione della libreria in Javascript/NodeJs e della progettazione in Fly.

Abstract del Seminario "Outlier Detection" di Salvatore Santelia:

Negli ultimi anni stiamo osservando una crescita vertiginosa degli open data. Ciò nonostante, non sempre la correttezza dei dati è garantita e
offrire delle tecniche automatiche di individuazione di errori è di fondamentale importanza.
Il mio lavoro si basa sull' outlier detection (o anomaly detection), ovvero l'individuazione di dati che divergono dal modello generale, soffermandomi
nello specifico, sullo studio dell' outlier detection su numeri e date.
Da un punto di vista tecnico, ho sfruttato tecniche di clustering e approcci statistici.
In questo seminario riporterò i risultati dei diversi approcci applicati a Open Data di diversa natura, ad esempio Views di YouTube, Inspection Scores, Altezza Onde.
Per quanto concerne le date presenterò un possibile processo per distinguere outlier (intesi come valori erroneamente divergenti dagli altri) e natural outlier (valori divergenti dagli altri per loro natura) riportando un esempio di applicazione di questo processo sfruttando DBpedia.

Laboratorio ISISLab, Dipartimento di Informatica, Università di Salerno (Edificio F, Lab. 10, II piano)

Via Giovanni Paolo II, 132, 84084 Fisciano SA
Fisciano, Italy Italy
+ Google Maps