Pour commencer
- Lancer Spyder avec Python 2.7 pour ce TP (pas Idle, pas Python 3), et vérifiez que ça fonctionne. On utilisera l'interpréteur actif et pas un interpréteur dédié (appuyer sur F6 : Configurer...). On peut aussi (a priori) utiliser Pyzo.
- Récupérez les images utiles pour ce TP sur le lecteur réseau (lecteur S: (groupes), classe, données, info commune, TP Images) et copiez-les dans votre répertoire personnel.
Différences entre le type list
de python, et array
dans numpy
Dans la suite, on va utiliser un nouveau type de tableau : array
disponible dans le module numpy
- Un seul type pour tous les éléments
- Un format (ligne et colonnes) comme un vrai tableau
- l'opérateur plus : source de confusions (concaténation vs. opération terme à terme) !
- range vs. arange
- L'affichage est plus joli...
- Sinon c'est très proche : on peut accéder aux éléments de la même façon et faire du slicing
Avec les listes python (essayez de prévoir les résultats obtenus dans python, tester, comprendre) :
# Dans l'interpréteur c'est aussi simple...
>>> a = [1, 2, 3]
>>> b = [4, 5, 6]
>>> a + b
>>> 2 * a
>>> 3 + a # Erreur, c'est normal
>>> range(0, 10, 2)
>>> range(0, 10, 0.5) # Erreur
>>> tab = [[i + j for i in range(10)] for j in range(15)]
Presque la même chose mais avec le type array
de numpy
: Notez bien les différences !
>>> import numpy as np
>>> a = np.array([1, 2, 3])
>>> b = np.array([4, 5, 6])
>>> a + b
>>> 2 * a
>>> 3 + a
>>> np.arange(0, 10, 2)
>>> np.arange(0, 10, 0.5)
>>> tab = [[i + j for i in range(10)] for j in range(15)]
>>> nptab = np.array(tab) # C'est pus joli
>>> nptab
>>> nptab.shape # Le format du tableau (lignes, colonnes, ...)
Une autre contrainte : les éléments considérés auront un type particulier (pas les entiers de python) :
>>> a = np.array([1, 2, 3], dtype = np.uint8) # On travaille avec des entiers (positifs)
# sur 8 bits donc entre 0 et 255
>>> a + 250
>>> a + 255
Images : des pixels
On va utiliser plusieurs modules de python dont numpy
pour les calculs et Python Image Library (PIL)
pour manipuler les images :
import numpy as np
import matplotlib.pyplot as plt
import PIL.Image as im
import math
Lire / Afficher / Enregistrer une image dans un fichier
# Lecture du fichier
def lire_fichier(fichier):
image = im.open(fichier)
# On dit à python que chaque valeur est un entier entre 0 et 255
pixels = np.asarray(image, np.uint8)
return pixels
# Affichage
def affiche(pixels):
plt.imshow(pixels) # plt.imshow(pixels, cmap = 'Greys_r') # niveaux de gris
#plt.show() # décommenter si l'image ne s'affiche pas
# Enregistrement dans un fichier
def enregistrer(pixels, fichier)
image = im.fromarray(pixels)
image.save(fichier)
# Utilisation
fichier_joconde = "images\joconde.jpg" # si le fichier est dans le répertoire 'images'
pixels_joconde = lire_fichier(fichier_joconde)
# C'est ici qu'on peut modifier l'image ou l'utiliser
print(pixels_joconde.shape) # Affichage du format
plt.imshow(pixels_joconde) # Affichage du gros tableau de pixels
enregistrer(pixels_joconde, "joconde.bmp") # On peut utiliser l'extension .bmp, .png, .tif
# L'enregistrement en .jpg semble ne pas fonctionner au lycée
Remarque sur les format de fichiers
Les fichiers que vous avez à votre disposition sont en différents formats\footnote{Le format d'une image (bitmap, jpeg, png...) ne signifie pas la même chose que le format d'un tableau numpy (dimensions)} : certains sont compressés, d'autres non. Dans tous les cas (à la lecture ou à l'écriture), le module PIL fait la conversion. Le format BMP n'étant pas compressé c'est un des moins utilisés maitenant, mais on va l'utiliser pour parler de taille de fichier.
Certaines images sont en couleur : on stocke chaque pixel (picture element) avec 3 octets (rouge, vert, bleu).
- Utilisez python pour ouvrir l'image 'joconde.tif' et afficher son format (avec pixels.shape). On obtient (1600, 1058, 3) : c'est la hauteur, la largeur, et le nombre d'octet pour chaque pixel.
D'autres images sont en niveaux de gris : ouvrir 'hepburn.tif' et afficher son format. On obtient (621, 451) : la hauteur est de 621 pixels, la largeur de 451 pixels, et il n'y a qu'un seul octet par pixel (pour la composante de gris)
Modifications
Composantes
On va travailler sur la joconde :
def rouge(pixels):
hauteur, largeur, _ = pixels.shape
vide = np.zeros(pixels.shape, np.uint8) # Crée une nouvelle image du même format
for y in range(hauteur):
for x in range(largeur):
(r, v, b) = pixels[y][x] # On récupère les composantes rouge, vert, bleu
vide[y][x] = (r, 0, 0) # Ici on ne garde que le rouge
return vide
pix = lire_fichier('images\joconde.jpg')
pix_rouge = rouge(pix) # C'est très long, c'est normal (4 secondes chez moi)
enregistrer(pix_rouge, 'rouge.bmp')
-
Que faut-il faire pour récupérer la composante de vert ? de bleu ?
-
Comment obtenir le négatif de l'image ? (Pour chaque composante $c$ dans $r, v, b$, on calcule $255 - c$)
-
On peu rendre l'image plus claire en augmentant la valeur de chaque composante. Que se passe-t-il pour les valeurs trop grandes ? Si vous bloquez, faites l'exercice suivant et revenez ici... Régler le problème avec branchements conditionnels (if). Ou l'utilisation judicieuse de la fonction
min
.
Niveaux de gris
- On souhaite transformer cette image en niveaux de gris : on peut affecter à chaque couleur la moyenne des composantes (r, v, b) Par exemple : (100, 12, 49) -> moyenne de 54 environ -> (54, 54, 54)
# Le code ci-dessous ne fait pas ce que l'on veut, pourquoi ?
r, v, b = pixels[y][x] # On récupère les composantes rouge, vert, bleu
moyenne = (r+v+b)/3
vide[y][x] = moyenne, moyenne, moyenne
On peut s'en sortir avec\footnote{Dans ce cas précis, on peut aussi faire les divisions avant les additions...} :
def niveau_gris(pixels):
hauteur, largeur, _ = pixels.shape
vide = np.zeros(pixels.shape, np.uint8) # Crée une nouvelle image du même format
for y in range(hauteur):
for x in range(largeur):
(r, v, b) = np.int16(pixels[y][x]) # On récupère les composantes rouge, vert, bleu
moyenne = (r + v + b) / 3
vide[y][x] = np.uint8((moyenne, moyenne, moyenne))
return vide
-
Seuiller un image consiste à transformer chaque pixel en blanc (255, 255, 255) ou noir (0, 0, 0) selon que son niveau de gris est plus petit ou plus grand qu'un seuil donné.
-
On peut aussi seuiller couleur par couleur
-
La couleur sepia est $(94, 38, 18)$. On décide que si le niveau de gris est plus petite qu'un seuil, on remplace le pixel par une moyenne pondére (barycentre) entre un pixel noir et la couleur sepia. Si le niveau de gris est plus grand que le seuil, on calcule une moyenne pondérée entre le sepia et le blanc.
-
Pour augmenter le contraste : on augmente les valeurs associées aux pixels clairs, et on diminue celles des pixels foncés.
Flou, lissage, accentuation
-
On peut créer un effet de flou (lissage) en remplaçant chaque pixel par la moyenne des 9 pixels qui l'entoure. On pourra utiliser du slicing... et on fera surtout attention à ne pas accéder à des cases hors du tableau !!! [[1/9, 1/9, 1/9], [1/9, 1/9, 1/9], [1/9, 1/9, 1/9]]
-
Accentuation : presque comme le flou, mais en pondérant les cases adjacentes différement. [[0, -0.5, 0], [-0.5, 3, -0.5], [0, -0.5, 0]]
Aller plus loin
Morceau d'une image
- Utiliser le slicing (sur les deux première composantes) pour récupérer une partie d'une image. On commencera par remarquer que la syntaxe n'est pas la même que d'habitude, y réfléchir, et comprendre pourquoi la syntaxe classique ne renvoie pas ce que l'on veut...
pixels[:2, :5]
-
Blanchir (mettre à 255) la zone $[60, 180[ \times [120, 200[$ de l'image Mona Lisa
-
Echangez deux parties de l'image de Mona Lisa : $[90, 190[ \times [120, 220[$ et $[400, 500[ \times [80, 180[$. Quelle est la difficulté classique quand on veut échanger le contenu de deux variables ? C'est pareil ici...
Modifier la forme de l'image
-
On voit l'image comme un grand tableau : recopier l'image en 4 petits exemplaires comme dans un photomaton... ou en 9, 16, ...
-
On peut imaginer à peu près n'importe quelle transformation géométrique dans le plan (translation, rotation, homothétie) mais aussi appliquer n'importe quelle fonction du plan dans le plan qui 'déplace' des pixels. Amusez-vous ! Attention : que se passe-t-il quand on sort de l'image ?
Répartition des couleurs : histogram
- Que renvoie la ligne suivante ?
im.open('joconde.jpg').histogram()
- Écrire votre propre fonction python qui calcule l'histogramme de répartition des niveaux de gris / couleurs d'une image (plus lent oui...)
Détection de bords
On considère une image en niveaux de gris : Pour chaque pixel (sauf ceux du bord), on considère ses 4 pixels adjacents : $haut, bas, gauche, droite$. On calcule la valeur du changement de ce pixel $\sqrt{(droite - gauche)^2 + (haut - bas)^2)}$. Si ce changement est plus petit qu'un certain seuil, on lui associe un pixel blanc. Noir sinon.
Miscéllanées
- De nombreux exemples de traitement d'image utilisent l'image appelée "Lena". On pourra découvrir son histoire et la photo originale (NSFW) sur \url{lenna.org} (avec deux 'n')
from scipy import misc
l = misc.lena()
misc.imsave('lena.png', l) # nécessite PIL
- Réaliser une interface graphique (simplement des boutons) pour faciliter l'utilisation par l'utilisateur des fonctions précédentes. Voici un mini exemple. Appelez les fonctions précédentes à l'aide de boutons.
# coding: utf8
from Tkinter import Tk, Label, Button
def bonjour():
print("Bonjour !")
master = Tk()
master.title("Ma première fenêtre")
master.label = Label(master, text="Du texte")
master.label.pack()
# Remarque : on nomme la fonction 'bonjour' sans parenthèses.
master.bonjour_button = Button(master, text="Bonjour", command=bonjour)
master.bonjour_button.pack()
master.close_button = Button(master, text="Close", command=master.quit)
master.close_button.pack()
master.mainloop()
-
Seam carving : on pourra lire http://en.wikipedia.org/wiki/Seam_carving (en anglais). On pourra s'inspirer de l'exercice sur la détection de bords : on souhaite trouver des chemins (de haut en bas de l'image) qui traversent "peu de bords"... on commencera pas regarder une video sur internet.
-
(plus dur) Peut-on utiliser le même principe pour rajouter une colonne de pixels ? plusieurs colonnes ?
-
Tout ce qu'on vient de faire est très lent : pour aller plus vite dans certains cas (typiquement toutes les transformations qui modifient les couleurs point par point), on peut utiliser les fonctions "vectorisées" dans numpy.
-
Sinon il existe d'autres bibliothèques (modules) que PIL / numpy qui sont encore plus adaptées à la manipulation d'image en python : OpenCV / SimpleCV\footnote{\url{http://tutorial.simplecv.org/}. CV : Computer Vision}.