Algorithm complexity

Reading time15 min

En bref

Résumé de l’article

Dans cet article, vous apprendrez une notion théorique importante pour comparer les algorithmes : la complexité. Dans les articles précédents, vous avez déjà rencontré certaines notations comme $O(n)$. Nous allons maintenant la rendre plus explicite.

Points clés

La complexité d’un algorithme est une mesure abstraite du temps nécessaire à son exécution, en fonction de ses entrées.
Elle fait abstraction des éléments spécifiques à la machine tels que la performance du CPU, contrairement aux mesures de temps.
La complexité est généralement donnée dans le pire des cas.
Nous utilisons la notation $O(\cdot)$, car nous nous intéressons à l’ordre de grandeur du temps nécessaire, asymptotiquement.

Contenu de l’article

1 — Vidéo

Veuillez regarder la vidéo ci-dessous. Vous pouvez également lire la transcription si vous préférez.

Information

Cliquez ici pour afficher/masquer la transcription de la vidéo.

C’est encore moi, bienvenue à nouveau ! Je vois que vous avez faim d’en apprendre davantage sur les concepts liés aux algorithmes !

Dans cette leçon, nous allons jeter un œil à ce qu’on appelle la “complexité des algorithmes”.

Une introduction à la complexité des algorithmes

La complexité d'un algorithme est une mesure du nombre maximal d'opérations élémentaires nécessaires à son exécution, en fonction de la taille de l'entrée.

Il est évident que différentes entrées de même taille peuvent amener un algorithme à se comporter différemment. En conséquence, la fonction décrivant sa performance est généralement une borne supérieure sur la performance réelle, déterminée à partir des pires entrées possibles pour l'algorithme. Vous devez donc retenir ici que la complexité contient une notion de "pire cas".

Cependant, pour bien comprendre le concept de complexité, nous devons définir deux choses plus précisément. Prêt ?

Une "opération élémentaire" est généralement une opération qui peut être exécutée en très peu de temps par l'unité centrale de traitement, ou CPU, de l'ordinateur sur lequel l'algorithme est implémenté. Par exemple, l'addition, la multiplication et l'accès mémoire sont considérés comme des opérations élémentaires.

Parfois, additionner ou multiplier des nombres peut être très coûteux en temps. Cela peut être vrai lorsqu’on additionne ou multiplie des nombres entiers très grands, comme ceux utilisés dans certains algorithmes cryptographiques. Donc, en d’autres termes, la définition des opérations élémentaires dépend de la tâche.

La deuxième chose à comprendre est que la taille de l’entrée dépend du contexte de l’algorithme.

Par exemple, si nous considérons l'addition de deux entiers, la taille serait le logarithme en base 2 du plus grand nombre, c'est-à-dire le nombre de bits utilisés pour le représenter en mémoire.

Dans le cas d'algorithmes impliquant des graphes, la taille peut être le nombre d'arêtes ou de sommets.

Passons à la suite. La complexité est généralement exprimée sous la forme d'un "comportement asymptotique" en utilisant la notation "grand O".

Et pourquoi ? Parce que connaître ce comportement asymptotique est souvent suffisant pour décider si un algorithme est assez rapide, et il est souvent inutile d’avoir des estimations plus précises.

Le comportement asymptotique exprimé par la notation grand O nous fait négliger les constantes et les termes de bas ordre. C’est parce que lorsque la taille du problème devient suffisamment grande, ces termes ne comptent plus.

Notez que deux algorithmes peuvent avoir la même complexité temporelle en grand O, même si l’un est toujours plus rapide que l’autre.

Par exemple, supposons que l'algorithme 1 nécessite un temps $n^2$, et l'algorithme 2 nécessite un temps $10 n^2+3n$. Pour les deux algorithmes, la complexité est $O(n^2)$, mais l'algorithme 1 sera toujours plus rapide que l'algorithme 2 avec la même entrée. Dans ce cas, les constantes et les termes de bas ordre comptent.

Cependant, les constantes ne comptent pas pour la question de l'évolutivité, qui s'intéresse à la façon dont le temps d'exécution de l'algorithme change en fonction de la taille du problème. Bien qu'un algorithme nécessitant un temps $n^2$ sera toujours plus rapide qu'un algorithme nécessitant un temps $10n^2 +3n$, pour les deux algorithmes, pour $n$ suffisamment grand et si la taille du problème double, le temps réel sera multiplié par quatre.

Typiquement, les algorithmes considérés comme rapides sont ceux avec une complexité linéaire, $O(n)$, ou ceux pour lesquels la complexité est $O(n \cdot log(n))$. Les algorithmes pour lesquels la complexité est $O(n^k)$ pour $k \geq 2$ sont considérés comme ayant une complexité raisonnable, selon le domaine d'application. Les algorithmes ayant au moins une complexité exponentielle sont rarement utilisés en pratique.

Complexité des algorithmes que nous avons vus jusqu’à présent

Mettons cela en contexte avec les algorithmes que nous avons vus jusqu’à présent. Tant le DFS que le BFS examinent chaque sommet d’un graphe une fois, et pour chaque sommet, ils considèrent tous ses voisins.

Par conséquent, leur complexité est de l'ordre du nombre d'arêtes dans le graphe, $O(|E|)$.

Concernant l'algorithme de Dijkstra, la complexité dépendra largement de l'implémentation du tas minimum. En pratique, il est possible d'obtenir une complexité de $O(|E|+|V| \ln(|V|))$. Cependant, nous ne démontrerons pas ce résultat ici.

Mots de conclusion

Cela conclut la leçon d’aujourd’hui sur la complexité des algorithmes. Comme vous l’avez peut-être deviné, la complexité est un outil important pour évaluer la performance d’un algorithme avant de commencer à l’implémenter.

Par exemple, imaginez que vous souhaitez implémenter une intelligence artificielle dans un jeu. Comme la complexité temporelle est directement liée au temps de calcul, et que le temps de calcul est directement lié au temps de réponse de votre intelligence artificielle, vous voyez à quel point cette question est importante si vous souhaitez battre vos adversaires.

À la semaine prochaine, où vous apprendrez un problème très important en informatique : le problème du voyageur de commerce, ou TSP. Malheureusement, nous verrons aussi que les algorithmes pour le résoudre sont très complexes. Mais heureusement, cela ne signifie pas qu’ils sont compliqués à comprendre.

Pour aller plus loin

2 — Remarques sur la complexité des algorithmes

Il est souvent tentant de comparer les comportements asymptotiques des complexités des algorithmes pour en tirer des conclusions. C’est pourquoi ils sont le plus souvent utilisés, mais parfois le diable est dans les détails.

2.1 — Pire cas

La complexité d’un algorithme est définie comme le nombre d’opérations élémentaires requises pour le pire cas possible. En pratique, l’algorithme peut être rapide dans presque tous les cas. Un exemple d’algorithme célèbre avec cette propriété est l’algorithme du simplexe.

2.2 — Comportement asymptotique

Prenons deux fonctions $f$ et $g$ de $n$. Nous pouvons assez facilement avoir $f(n) = O(g(n))$ et pourtant $f(n) > g(n)$ pour tout $n > N$. En pratique, certains algorithmes peuvent avoir un comportement asymptotique plus favorable mais être beaucoup plus lents en pratique. Un exemple célèbre est le test de primalité.

2.3 — L’importance des constantes

Les écritures du comportement asymptotique ignorent les constantes. En particulier, on peut écrire $10^{10^{10^{10^{10}}}} n^2 = O(n^2)$. Cependant, un algorithme dont la complexité est exactement $10^{10^{10^{10^{10}}}} n^2$ est $10^{10^{10^{10^{10}}}}$ fois plus lent qu’un algorithme dont la complexité est exactement $n^2$.

Pour aller au-delà

Fonction d’Ackermann.

Cette fonction qui croît très rapidement apparaît parfois dans la complexité de certains algorithmes très exigeants.

L’algorithme du simplexe.

Un algorithme populaire pour résoudre des problèmes, avec une complexité de $O(2^n)$

Le test de primalité.

Déterminer si un nombre est premier a un comportement asymptotique favorable mais est lent en pratique.