***
# TP 1 : algorithmes de gradient pour la minimisation d'une fonctionnelle quadratique
***

Soit $A$ la matrice symétrique de taille $5$ définie par
$$
A =
\left(
\begin{array}{ccccc}
3 &-1& 0& 0& 0 \\
-1& 12& -1& 0& 0 \\
0 &-1& 24& -1& 0 \\
0& 0& -1& 48& -1 \\
0& 0& 0& -1& 96 \\
\end{array}
\right)
$$
et soit $b$ le vecteur défini par
$$
b =
\left(
\begin{array}{c}
1 \\
2 \\
3 \\
4 \\
5 \\
\end{array}
\right)
$$
Définir $A$ et $b$ comme des tableaux <i>numpy</i>. Vérifier leurs dimensions à l'aide de la commande <i>shape</i>.

In [13]:
#permet d'afficher les variables sans utiliser la commande print
from IPython.core.interactiveshell import InteractiveShell 
InteractiveShell.ast_node_interactivity = "all"
# on importe les librairies math et numpy
import math
import numpy as np
A=np.array([[3,-1,0,0,0],[-1,12,-1,0,0],[0,-1,24,-1,0],[0,0,-1,48,-1],[0,0,0,-1,96]])
b=np.array([1,2,3,4,5]).transpose()
A.shape
b.shape


(5, 5)

(5,)

On considère la fonctionnelle f définie sur $\mathbb{R}^5$ par
$$
f(x) = \frac{1}{2} (Ax,x) - (b,x)
$$
1) Vérifier que la matrice A est symétrique définie
positive. En déduire l'existence et l'unicité d'un point de minimum $x^*$ de f
sur $\mathbb{R}^5$.

In [21]:
A2=A[0:2,0:2]
A3=A[0:3,0:3]
A4=A[0:4,0:4]
d2=np.linalg.det(A2)
d2
d3=np.linalg.det(A3)
d3
d4=np.linalg.det(A4)
d4
d5=np.linalg.det(A)
d5

35.000000000000007

837.00000000000011

40141.000000000022

3852699.0000000028

2) Donner une caractérisation de ce point de minimum (condition d'optimalité du premier ordre).

3) Calculer les plus petite et plus grande valeurs propres de $A$, notées $\lambda_1$ et $\lambda_5$.

In [25]:
vp=np.linalg.eigvals(A)
lambda1=min(vp)
lambda5=max(vp)
lambda1
lambda5

2.8896602831374647

96.020830320247825

4) On rappelle que l'algorithme du gradient à pas fixe est défini par
$$
x_{k+1} = x_k + \rho d_k, \quad d_k = -\nabla f(x_k).
$$
Cet algorithme converge vers $x^*$ pour toute initialisation $x_0$ si $\rho$ est choisi tel que
$$
0 < \rho < \frac{2}{\lambda_5}
$$
et la vitesse maximale de convergence est obtenue pour le choix
$$
\rho = \frac{2}{\lambda_1 + \lambda_5}.
$$
Proposer pour cet algorithme un test d'arrêt. 

Ecrire une fonction GPF qui 
<ul>
<li >prend en arguments 
d'entrée $A$, $b$, $x_0$, la précision $epsilon$, le nombre d'itérations maximum $maxiter$, et le pas $rho$ </li>
<li> renvoie la solution obtenue $x$, le nombre d'itérations $nbiter$,  et le vecteur de la norme des résidus $residu$</li>
</ul>

In [50]:
def GPF(A,b,x0,epsilon,maxiter,rho):
 x=x0
 nbiter=0  
 residu=np.linalg.norm(np.matmul(A,x)-b)
 while (residu>epsilon)&(nbiter<maxiter):   
     x=x-rho*(np.matmul(A,x)-b)
     nbiter=nbiter+1
     residu=np.linalg.norm(np.matmul(A,x)-b)   
 return [x,nbiter,residu]

Tester votre algorithme en choisissant pour $x_0$ le vecteur nul, $maxiter=20000$, $epsilon=10^{-5}$, et par exemple 
les valeurs $\frac{2}{\lambda_1 + \lambda_5}$ et $\frac{1}{\lambda_1 + \lambda_5}$ pour $\rho$.
Commenter.

In [63]:
x0=np.array([0,0,0,0,0]).transpose()
epsilon=10**(-5)
maxiter=20000
rho=2/(lambda1+lambda5)
res=GPF(A,b,x0,epsilon,maxiter,rho)
print('solution approchée',res[0])
print('nombre iterations',res[1])
print('residu',np.linalg.norm(np.matmul(A,res[0])-b) )


solution approchée [ 0.40392412  0.21178207  0.1374618   0.08730114  0.05299272]
nombre iterations 396
residu 9.78205839509e-06


5) On rappelle que l'algorithme du gradient à pas optimal est défini par
$$
x_{k+1} = x_k + \rho_k d_k, \quad d_k = -\nabla f(x_k), \quad 
%\rho_k = \frac{(d_k,d_k)}{(Ad_k,d_k)}.
$$
où $\rho_k$ minimise sur $\mathbb{R}^*_+$ la fonction 
$$\varphi(\rho)=f(x_k+\rho d_k).$$
Déterminer l'expression de $\rho_k$ en fonction de $A$ et $d_k$. 

Ecrire une fonction associée à cet algorithme et comparer 
avec la méthode du gradient à pas fixe.

In [66]:
def GPO(A,b,x0,epsilon,maxiter):
 x=x0
 nbiter=0  
 residu=np.linalg.norm(np.matmul(A,x)-b)
 while (residu>epsilon)&(nbiter<maxiter):   
     r=np.matmul(A,x)-b
     rho=residu*residu/np.matmul(r.transpose(),np.matmul(A,r))
     x=x-rho*(np.matmul(A,x)-b)
     nbiter=nbiter+1
     residu=np.linalg.norm(np.matmul(A,x)-b)   
 return [x,nbiter,residu]

In [67]:
x0=np.array([0,0,0,0,0]).transpose()
epsilon=10**(-5)
maxiter=20000
rho=2/(lambda1+lambda5)
res=GPO(A,b,x0,epsilon,maxiter)
print('solution approchée',res[0])
print('nombre iterations',res[1])
print('residu',np.linalg.norm(np.matmul(A,res[0])-b) )

solution approchée [ 0.40392519  0.21178219  0.1374618   0.08730114  0.05299265]
nombre iterations 202
residu 9.33907835443e-06
