Fondamenti di pytorch: tensori e operazioni di base

Luca Terribili

21 Novembre 2024

Alla base di tutta la potenza di PyTorch sta la sua capacità di manipolare efficacemente i tensori, strutture dati multidimensionali che costituiscono il mattone fondamentale per rappresentare dati in ambito scientifico e di machine learning. In questo articolo, esploreremo i concetti chiave relativi ai tensori e alle operazioni basilari in PyTorch, gettando le basi per un'esperienza più approfondita con questa libreria.

Prima di tutto, cosa sono i tensori? Possiamo immaginarli come generalizzazioni di array e matrici a un numero arbitrario di dimensioni. Un tensore unidimensionale è semplicemente un vettore, un tensore bidimensionale è una matrice, mentre un tensore tridimensionale può rappresentare, ad esempio, una sequenza di immagini a colori (altezza, larghezza, canali colore). In PyTorch, questi tensori sono rappresentati da oggetti della classe torch.Tensor. La loro creazione è intuitiva e si basa spesso sulla conversione da altre strutture dati Python, come liste o NumPy arrays.

Ad esempio, per creare un tensore da una lista di numeri, possiamo utilizzare il costruttore torch.Tensor():

import torch

lista = [1, 2, 3, 4, 5]
tensore = torch.Tensor(lista)
print(tensore)

Questo codice crea un tensore unidimensionale contenente i numeri della lista. Possiamo specificare anche le dimensioni desiderate durante la creazione del tensore, utilizzando funzioni come torch.zeros(), torch.ones(), torch.rand(), che rispettivamente creano tensori riempiti con zeri, uni, o numeri casuali uniformemente distribuiti tra 0 e 1. Ad esempio, per creare una matrice 3x4 di zeri, si scriverebbe:

matrice_zeri = torch.zeros(3, 4)
print(matrice_zeri)

La gestione delle dimensioni è un aspetto cruciale nella manipolazione dei tensori. PyTorch fornisce metodi efficienti per accedere alle dimensioni di un tensore tramite l'attributo .shape (o .size()), che restituisce una tupla contenente il numero di elementi lungo ciascuna dimensione. Per esempio, tensore.shape restituirà la forma del tensore tensore creato precedentemente. La conoscenza della forma è fondamentale per eseguire correttamente operazioni tra tensori, assicurando la compatibilità dimensionale.

Una volta creati i tensori, possiamo eseguire su di essi una vasta gamma di operazioni. Le operazioni aritmetiche elementari (addizione, sottrazione, moltiplicazione, divisione) sono definite elemento per elemento. Questo significa che l'operazione viene eseguita tra gli elementi corrispondenti di due tensori della stessa forma. Ad esempio, sommare due tensori di dimensioni uguali produce un nuovo tensore in cui ogni elemento è la somma degli elementi corrispondenti nei tensori di input.

PyTorch offre anche funzioni per operazioni più complesse, come il prodotto matriciale (torch.mm() o l'operatore @), la trasposizione (torch.t() per matrici, .T per tensori di rango superiore), il calcolo di somme, medie e altre statistiche descrittive lungo una o più dimensioni (torch.sum(), torch.mean()). Queste funzioni sono ottimizzate per l'esecuzione su GPU, offrendo prestazioni significativamente superiori rispetto a implementazioni equivalenti in Python puro.

Un altro aspetto fondamentale è la manipolazione della forma dei tensori. Spesso è necessario rimodellare i tensori per adattarli alle esigenze di un algoritmo specifico. La funzione torch.reshape() permette di cambiare la forma di un tensore, a condizione che il numero totale di elementi rimanga invariato. Ad esempio, un tensore 1D con 12 elementi può essere rimodellato in una matrice 3x4 o in un tensore 2x2x3.

La flessibilità di PyTorch si estende anche alla gestione dei tipi di dati. I tensori possono contenere valori di diversi tipi, come interi (torch.int32, torch.int64), numeri a virgola mobile (torch.float32, torch.float64) e altri. La scelta del tipo di dato dipende dall'applicazione e dalle caratteristiche dei dati. È importante considerare che la scelta del tipo di dato influisce sulle prestazioni e sulla precisione dei calcoli.

Infine, per chi proviene da NumPy, PyTorch offre un'interfaccia molto simile. Molte funzioni sono analoghe a quelle di NumPy, semplificando la transizione. Inoltre, la conversione tra tensori PyTorch e array NumPy è semplice e efficiente, tramite le funzioni torch.from_numpy() e .numpy().

In conclusione, la comprensione dei tensori e delle operazioni di base in PyTorch è essenziale per chiunque voglia utilizzare questa potente libreria per il deep learning o il calcolo scientifico. La sua interfaccia intuitiva, le prestazioni ottimizzate e la vasta gamma di funzionalità rendono PyTorch uno strumento versatile e potente per affrontare una grande varietà di problemi. Questo articolo ha fornito una panoramica introduttiva, ma l'esplorazione delle funzionalità più avanzate di PyTorch aprirà un mondo di possibilità per la manipolazione di dati e lo sviluppo di modelli di intelligenza artificiale.

Fondamenti di PyTorch: Tensori e operazioni di base