Algoritmi/L'analisi di complessità degli algoritmi

Da testwiki.
Vai alla navigazione Vai alla ricerca

Template:Algoritmi L'analisi di complessità è un metodo formale per prevedere le risorse richieste dall'algoritmo (cioè il tempo di esecuzione e la quantità di memoria utilizzata).

  • Il tempo però non è un tempo fisico o misurato sperimentalmente su un processore, ma dipende dal numero di passi → l'analisi di complessità è indipendente dalla macchina. Si assume che la macchina lavori in modo sequenziale e non parallelo (architettura di Von Neumann). Un algoritmo meno complesso su una macchina più lenta può essere più veloce.
  • L'analisi è indipendente da quali dati in ingresso ci sono ma è dipendente solo da quanti dati in ingresso ci sono, cioè più in generale dalla dimensione n del problema.
Output
  • S(n): memoria richiesta
  • T(n): tempo di esecuzione
Classificazione degli algoritmi per complessità (dal meno complesso al più complesso)
  • costante: 1
  • logaritmico: logn
  • lineare: n
  • linearitmico: nlogn
  • quadratico: n2
  • cubico: n3
  • esponenziale: 2n

Analisi di complessità di caso peggiore

L'analisi di complessità è detta:

  • asintotica se il numero di dati tende a infinito;
  • di caso peggiore se il tempo stimato non può che essere maggiore o uguale al tempo effettivo su uno specifico dato.

Si stima il caso peggiore perché è quello più frequente generalmente, e perché il caso medio spesso è difficile da calcolare o coincide con il peggiore.

Ricerca sequenziale
T(n)n
Ricerca dicotomica

Bisogna considerare il caso peggiore: la chiave non si trova. Alla i-esima iterazione, la lunghezza del sottovettore è uguale a 12i. La terminazione avviene quando il vettore è lungo 1=12i;i=log2n.

Insertion sort

Nel caso peggiore, ad ogni iterazione del ciclo esterno si fanno i − 1 scansioni del vettore, e all'ultima se ne fanno n − 1:

T(n)=1+2++(n2)+(n1)=n(n1)2T(n)n2

Notazioni

O grande (O)

T(n)=O(g(n))c>0,n0>0:nn00T(n)cg(n)

g(n) è un limite superiore lasco:

  • superiore: è una funzione maggiorante, a partire da un certo n0;
  • lasco: non scresce come g(n), ma al più come g(n).

Se T(n) è un polinomio in n di grado mT(n)=O(nm).

Omega grande (Ω)

T(n)=Ω(g(n))c>0,n0>0:nn00cg(n)T(n)

g(n) è il limite inferiore lasco della complessità asintotica di caso peggiore (≠ caso migliore). Se si dimostra che, per una certa operazione, la Ω è maggiore della complessità lineare, non si potrà mai trovare un algoritmo lineare che svolga quell'operazione.

T(n) polinomio → T(n)=Ω(nm)

Theta grande (Θ)

T(n)=Θ(g(n))c1,c2n0>0:nn00c1g(n)T(n)c2g(n)

g(n) è il limite asintotico stretto di T(n): T(n) cresce come g(n).

È la combinazione dei due precedenti:

  • T(n) polinomio → T(n)=Θ(nm);
  • T(n)=Θ(g(n))T(n)=O(g(n))T(n)=Ω(g(n))

Online connectivity

L'online connectivity è un problema avente per input un insieme di coppie di interi p e q (per es. i nodi di una rete). (p, q) definisce una relazione di connessione tra i nodi p e q.

Proprietà
  • commutativa: se p è connesso con qq è connesso con p;
  • transitiva: se p è connesso con qq è connesso con rp è connesso con r.

Le coppie possono essere:

  • mantenute: la connessione della coppia non è ancora nota (output: coppia (p, q));
  • scartate: la coppia è già connessa, anche per la proprietà transitiva o commutativa (output: nullo).
Applicazioni
  • reti di computer: ottimizzazione togliendo le connessioni ridondanti;
  • reti elettriche;
  • linguaggi di programmazione: variabili equivalenti.

La struttura dati a grafo è costituita da 2 insiemi: nodi p e q e archi.

Per ottimizzare il grafo, si verifica di volta in volta se la connessione della coppia in input non è ancora nota o se è implicata già dalle precedenti. L'analisi di questo genere presuppone l'esistenza del grafo → non è un'analisi di connettività online.

La connettività si dice online se si sta lavorando non su una struttura o su un modello pre-esistente, ma su un grafo che viene costruito arco per arco.

  1. ipotesi: si conoscono i vertici, e ogni vertice è connesso solo a se stesso → nessun arco;
  2. operazione find (ricerca): a ogni coppia in input, verifica se p e q appartengono allo stesso insieme (2 find);
  3. operazione union (unione): se p e q non erano connessi, unisci l'insieme a cui appartiene p (Sp) e l'insieme a cui appartiene q (Sq).

L'online connectivity può essere implementata tramite vettori:

  • quick-find: find rapide, union lente;
  • quick-union: find lente, union rapide.

Quick-find

A seconda del contenuto della cella del vettore:

  • se è il suo stesso indice i: il vertice i-esimo è connesso a se stesso;
  • se è un altro indice: i due vertici appartengono allo stesso insieme.
Complessità
  • find: accesso a una cella di vettore tramite il suo indice: O(1)
  • union: scansione del vettore per cambiare da p a q: O(n)

Complessità di caso peggiore totale: numero di coppie × dimensioni vettore (n)

riferimenti diretti (nessuna catena) → si trova subito il rappresentante Template:Clear

Quick-union

C'è una catena di riferimenti di tipo indiretto. A seconda del contenuto della cella del vettore:

  • se è uguale al suo indice i: fine catena;
  • se è diverso dal suo indice: passa alla cella i-esima a cui punta: id[id[...id[i]]...] = (id[i])*
Complessità
  • find: due elementi sono connessi se (id[i])* = (id[j])*: T(n)=O(n)
  • union: la testa della prima catena punta alla testa della seconda, cioè (id[p])* = (id[q])* → l'albero si frastaglia: T(n)=O(1)

Nella find si deve perciò percorrere tutta la catena fino alla testa, la union è immediata (unione solo delle teste).