Speaker: Valerio Di Pasquale
Titolo: Hypergraph Discrete Denoising Diffusion Probabilistic Models for Real-World Network Generation
Abstract:
Gli ipergrafi sono una generalizzazione dei grafi che estendono il concetto di relazione binaria permettendo la definizione di relazioni che collegano un numero arbitrario di nodi, rendendo tale struttura particolarmente adatta a modellare sistemi complessi nei quali sono naturalmente presenti relazioni multiple. Così come per i grafi, l'uso di modelli generativi per ipergrafi, hanno lo scopo di sintetizzare sistemi reali, simulando i complessi meccanismi che regolano la formazione di nuove relazioni. Questi modelli generativi, abilitano la risoluzione di diversi task, come l'anomaly detection, la link prediction, la creazione di dati sintetici e la simulazione dell'evoluzione dei sistemi. Tuttavia, mentre gli approcci basati su deep learning rimangono ancora poco esplorati, la maggior parte dei metodi generativi esistenti si basa su metodi algoritmici che mirano a riprodurre determinate caratteristiche strtturali delle reti. Vista la recente crescita e rivoluzione di approcci generativi nel campo della generazione di testo e immagini, questo scenario offre una opportunità significativa di avanzamento anche della generazione di ipergrafi. In questo lavoro di tesi viene introdotto un modello generativo per ipergrafi basato su Discrete Denoising Diffusion Probabilistic Models.
Speaker: Dario De Maio
Titolo: Hyperlink Prediction in Hypergraphs with nodes and edges textual representation
Abstract:
Negli ultimi anni, gli ipergrafi si sono affermati come uno strumento per modellare relazioni che coinvolgono un numero arbitrario di nodi, offrendo nuove opportunità per lo studio dei sistemi complessi. Uno dei problemi maggiormente affrontati in questo campo è stato quello della predizione di relazioni tra nodi (hyperlink prediction), tramite l'utilizzo delle loro rappresentazioni strutturali.
Inoltre, in letteratura sono stati proposti approcci che integrano informazioni aggiuntive oltre a quelle strutturali, come descrizioni testuali relative ai nodi, per migliorarne la rappresentazione e, di conseguenza, le capacità dei modelli di classificazione nel task di hyperlink prediction. Tali approcci, però, si concentrano esclusivamente sui nodi, trascurando eventuali informazioni testuali associate agli archi.
In questo lavoro di tesi si presenta un modello in grado di utilizzare sia informazioni testuali sui nodi che sugli iperarchi, al fine di costruire rappresentazioni più complete e potenziare la capacità predittiva nei task di hyperlink prediction.
Un ulteriore ostacolo che limita l'utilizzo di un tale modello è rappresentato dalla scarsa disponibilità di dataset che contengano descrizioni testuali anche per gli archi; in letteratura, infatti, sono disponibili quasi esclusivamente dati relativi ai nodi. Un secondo contributo di questo lavoro è stato quindi quello di estendere alcuni dataset esistenti, arricchendoli con informazioni descrittive sugli archi. A tal fine, è stato utilizzato un nuovo approccio basato sull'impiego dei Large Language Model, che consentono di generare facilmente descrizioni testuali aggiuntive a partire dalle informazioni già presenti.
Infine, per valutare l'impatto delle informazioni testuali, è stato condotto un ablation study mirato, che ha permesso di quantificare il contributo delle diverse tipologie di feature sulla qualità della predizione.