Luce splendente nella scatola nera del machine learning
CasaCasa > Blog > Luce splendente nella scatola nera del machine learning

Luce splendente nella scatola nera del machine learning

Jun 14, 2024

Gestore di portafoglio senior, uomo numerico

Finora sono stati fatti pochi progressi per sfruttare i modelli di machine learning per l’attribuzione del portafoglio di fattori. Spieghiamo dove e come gli investitori sistematici possono trovare spiegazioni granulari e locali della performance.

Agosto 2023

Sebbene i modelli di machine learning possano aver migliorato i rendimenti, gli investitori attualmente sono piuttosto ciechi riguardo alla provenienza di tali rendimenti.

La moderna gestione del portafoglio ha abbracciato sempre più i modelli di machine learning (ML) per prevedere i rendimenti grazie alla loro capacità di catturare interazioni complesse tra fattori. Lo svantaggio è che il risultato finale è spesso qualcosa di simile a un modello di scatola nera con output altamente ottimizzati. Ciò significa che spesso è difficile comprendere le previsioni e il processo decisionale di un modello. Per contrastare questo, vengono utilizzate tecniche di interpretazione o attribuzione del modello per tentare di spiegare la logica alla base delle previsioni del modello e per scoprire le caratteristiche che contribuiscono maggiormente al risultato. Tuttavia, finora sono stati fatti pochi progressi per sfruttare i modelli ML per l’attribuzione del portafoglio di fattori, che è una componente fondamentale dell’investimento sistematico di portafoglio. Senza questa evoluzione, è difficile comprendere con precisione quali fattori influenzano i rendimenti del portafoglio. Sebbene i modelli ML possano aver migliorato i rendimenti, gli investitori attualmente sono piuttosto ciechi riguardo alla provenienza di tali rendimenti.

Le metodologie esistenti di attribuzione dei fattori lineari soffrono di limitazioni come la mancanza di capacità di catturare gli effetti di interazione locale e l’assunzione implicita di una singola beta globale. Sosterremmo invece che gli investitori sistematici debbano guardare oltre i modelli di attribuzione lineare esistenti per trovare spiegazioni granulari e locali della performance.

Una soluzione è utilizzare il valore di Shapley. In questo articolo, approfondiamo cos'è il valore di Shapley, come può essere applicato per spiegare i risultati del modello e come calcoliamo i valori di Shapley utilizzando SHapley Additive ExPlanations (SHAP), un'implementazione specifica del valore di Shapley. Spiegheremo anche come un quadro di attribuzione della performance basato su SHAP può essere utilizzato per l'attribuzione di portafoglio locale e globale e introduciamo un innovativo sistema di attribuzione di portafoglio che utilizza il valore di Shapley e SHAP per spiegare sia il processo decisionale che la variazione di rendimento trasversale a livello locale e globale. livello globale. Dimostriamo anche il maggiore potere esplicativo dell'attribuzione SHAP incorporando modelli ML non lineari come XGBoost.

Se i modelli ML continuano a fornire rendimenti ragionevoli, perché preoccuparsi di perfezionare le metodologie di attribuzione? Insomma perché sono inadeguati. Le metodologie esistenti di attribuzione dei fattori come la regressione delle serie temporali, l’attribuzione dei rendimenti trasversali e l’attribuzione basata sulle partecipazioni si basano su modelli lineari, rendendoli incapaci di catturare gli effetti di interazione locale con l’ipotesi di un beta lineare globale.

Ad esempio, la regressione delle serie temporali è limitata dal problema della dimensionalità e dall’ipotesi di un beta costante nel tempo, il che la rende meno utile per la gestione dinamica del portafoglio. Al contrario, l’attribuzione trasversale del rendimento con una serie di fattori di rischio, come comunemente utilizzata dai fornitori di modelli di rischio, presuppone che la generazione di rendimento possa essere attribuita a un modello fattoriale globale lineare. Il suo cugino stretto, l’attribuzione basata sulle partecipazioni, stima l’esposizione delle partecipazioni del portafoglio a una serie di portafogli di fattori personalizzati. Sebbene tutte e tre le metodologie siano basate sulla stessa struttura di rendimento dei fattori lineari, differiscono in termini di sofisticazione e flessibilità di personalizzazione. Tuttavia, queste metodologie non sono in grado di catturare gli effetti di interazione a causa della relazione non lineare tra tali variabili indipendenti.

Il valore di Shapley è un concetto della teoria dei giochi cooperativi che misura il contributo di ciascun giocatore alla vincita di un gioco di coalizione.

Il valore di Shapley è un concetto della teoria dei giochi cooperativi che misura il contributo di ciascun giocatore alla vincita di un gioco di coalizione. I quattro assiomi del valore di Shapley1 assicurano che la distribuzione dei pagamenti sia equa quando i giocatori possono formare coalizioni e che i pagamenti dipendano dalla performance della coalizione. Il valore di Shapley è l’unico metodo di pagamento che soddisfa questi quattro assiomi. La distribuzione dei pagamenti viene calcolata in base al contributo marginale di un giocatore permutando tutte le combinazioni dei giocatori.