Heuristics

Reading time15 min

En bref

Résumé de l’article

Dans cet article, vous allez apprendre ce que sont les heuristiques. Ces algorithmes aident à approximer la solution à un problème trop complexe pour être résolu exactement.

Points clés

Une heuristique permet de trouver des solutions approximatives à un problème.
C’est un compromis entre la qualité de la solution trouvée et le temps de calcul nécessaire.
Elle encode une intuition sur la manière d’approximer une solution à un problème complexe.
Parfois, les heuristiques peuvent trouver des solutions optimales.

Contenu de l’article

1 — Vidéo

Veuillez regarder la vidéo ci-dessous. Vous pouvez aussi lire la transcription si vous préférez.

Information

Cliquez ici pour afficher la transcription de la vidéo.

Salut ! Content de voir que vous êtes arrivé à la semaine 5. Faisons un petit récapitulatif.

Dans la dernière leçon, nous avons vu que le problème du voyageur de commerce (ou TSP) est complexe à résoudre. Cependant, il est possible de réduire drastiquement la complexité de l’algorithme de résolution, à condition que la solution produite ne soit pas nécessairement optimale, mais suffisamment bonne.

Dans cette leçon, je vais introduire la notion d’algorithme heuristique, qui est une technique utilisée pour résoudre plus rapidement des problèmes lorsque les méthodes classiques sont trop lentes pour trouver une solution exacte. En d’autres termes, l’objectif d’une heuristique est de produire une solution dans un délai raisonnable qui soit assez bonne pour résoudre le problème posé.

Habituellement, les heuristiques échangent l'optimalité, la complétude, la précision ou l'exactitude contre la rapidité. D'une certaine manière, une heuristique peut être considérée comme un raccourci.

Une heuristique traduit le plus souvent une intuition qui n'est pas nécessairement soutenue par des arguments formels.

Exemple avec des algorithmes de parcours de graphe

À présent, vous devriez être familier avec plusieurs algorithmes de parcours de graphe, tels que BFS ou DFS, dont le résultat est d’obtenir un arbre couvrant un graphe à partir d’un sommet donné.

Si vous y réfléchissez, utiliser un chemin plutôt qu’un autre peut en soi être une heuristique.

Par exemple, considérez le problème suivant : à partir d'une page Wikipedia, par exemple la page Wikipedia sur le problème du voyageur de commerce, nous voulons arriver à une autre page Wikipedia, par exemple la page Wikipedia sur le nombre 42, en suivant les liens hypertextes.

Question : faut-il utiliser un DFS ou un BFS ?

Il ne fait aucun doute que les deux méthodes donneront le résultat attendu, étant donné la très forte connectivité du graphe des liens hypertextes de Wikipedia, mais ils n’y arriveront certainement pas de la même manière.

Qu’est-ce qu’une bonne heuristique ?

Alors, qu’est-ce qu’une bonne heuristique ?

Une heuristique est le plus souvent inspirée par une intuition, et il n’est donc pas facile d’évaluer sa qualité à l’avance.

Une heuristique doit avoir deux qualités importantes : fournir un gain, et être limitée en termes de complexité. Examinons ces deux caractéristiques plus en détail.

Fournir un gain

Pour fournir un gain, une heuristique doit améliorer la performance d’un algorithme selon un critère donné et comparé à d’autres heuristiques.

Par exemple, imaginez que je veuille aller de cette salle de classe, le X jaune sur la carte, à la cantine, le X rouge sur la carte, en un nombre minimum de pas.

Une heuristique possible pour y arriver est de se diriger dans ce que je sais être la direction générale de la cantine, en ignorant la présence de murs ou d'obstacles.

Cette heuristique aura probablement un résultat généralement meilleur que si j'utilisais une orientation aléatoire.

Mais dans certains cas, je pourrais me retrouver dans une impasse, auquel cas l’heuristique ne fournit pas de gain, et pire, ne fournit pas de solution.

Complexité limitée

Concernant la caractéristique de complexité limitée, si utiliser des heuristiques coûte autant que d’explorer toutes les possibilités, alors cela ne sert à rien, autant ne pas les utiliser !

En reprenant l'exemple où je cherche mon chemin de cette salle de classe à la cantine, supposons que pour trouver mon chemin je doive explorer tous les chemins possibles et compter le nombre de pas pour chacun d'eux. Je peux alors bien sûr choisir le chemin le plus court, mais comme j'ai dû explorer toutes les possibilités avant de le faire, j'aurai dû marcher beaucoup plus loin que si j'avais choisi une heuristique plus simple.

Évaluer la qualité

Pour évaluer la qualité d’une heuristique, il est généralement plus facile de faire cette évaluation ex post. Cela signifie qu’un choix sur l’heuristique est fait, implémenté, puis testé sur un grand nombre d’instances du problème, et enfin, les résultats sont comparés à ceux obtenus avec d’autres heuristiques.

Mots de conclusion

Cela conclut la leçon d’aujourd’hui sur les heuristiques. Dans la prochaine vidéo, vous apprendrez comment les heuristiques peuvent aider à fournir des solutions suffisamment bonnes au TSP. Au revoir !

Pour aller plus loin

2 — Heuristiques et solutions optimales

Comme indiqué précédemment, l’utilisation d’heuristiques peut conduire à trouver une solution correcte à un problème, mais pas nécessairement la solution optimale. C’est le cas par exemple de l’approche gloutonne, qui choisit itérativement des solutions localement optimales pour estimer un optimum global.

Cependant, utiliser une heuristique ne rend pas toujours une solution non optimale. Rappelez-vous par exemple l’algorithme bruteforce avec backtracking étudié précédemment.

L’efficacité du backtracking dépend fortement de l’ordre dans lequel les branches de l’arbre des solutions sont explorées. Dans la session précédente, vous avez probablement choisi de visiter les sommets restants dans le méta-graphe au fur et à mesure qu’ils apparaissent dans votre structure de méta-graphe comme ceci :

def solve_tsp (graph, source):
    ...
    for vertex in graph.get_neighbors(current_vertex):
        if vertex not in current_visited_vertices:
            # Explore that branch
    ...

Cependant, utiliser une heuristique pour encoder une intuition sur quel voisin devrait être exploré en premier peut être une bonne idée, car – si c’est une bonne heuristique – cela pourrait conduire à explorer rapidement des chemins courts, ce qui permettrait d’élaguer de nombreuses branches.

Le code partiel suivant est une solution possible, dans laquelle nous proposons d’utiliser un min-heap, qui contiendra tous les voisins, avec une valeur associée correspondant au score donné par l’heuristique. Puisqu’il s’agit d’un min-heap, plus le score est bas, meilleure est la qualité du voisin :

def heuristic (neighbor, ...):
    # Return a score for the neighbor to evaluate
    # In this example, the lower the better, but you could adapt the code to change that
    ...
    return XXX

def evaluate_neighbors (neighbors, ...):
    # Here, we use our heuristic to give a score to all candidate neighbors
    # Then, we use these scores to fill a min-heap
    scores = []
    for neighbor in neighbors:
        score = heuristic(neighbor, ...)
        heapq.heappush(scores, (score, neighbor))
    return scores

def solve_tsp (graph, source) :
    ...
    non_visited_neighbors = [neighbor for neighbor in graph.get_neighbors(current_vertex) if neighbor not in explored_vertices]
    scores = evaluate_neighbors(non_visited_neighbors, ...)
    while len(scores) > 0 :
        best_score, best_neighbor = heapq.heappop(scores)
        # Explore that branch in priority
    ...

Vous pouvez par exemple essayer de choisir comme heuristique de retourner un score qui est la distance entre le sommet exploré et le voisin candidat, i.e., le poids dans le méta-graphe.

3 — Méta-heuristiques

Le préfixe méta indique que le mot auquel il est associé est placé à un niveau d’abstraction supérieur. Dans ce cas, une méta-heuristique est une heuristique qui sera elle-même utilisée pour trouver des heuristiques afin de résoudre un problème.

Les méta-heuristiques permettent d’abstraire le problème de la recherche des bonnes heuristiques, en considérant les heuristiques comme une solution à un problème d’optimisation, dont l’objectif est de maximiser la précision sur le problème étudié, tout en limitant la complexité. Ainsi, une méta-heuristique est un algorithme qui va parcourir l’espace des heuristiques possibles, et choisir celle qui sera jugée plus optimale que les autres selon certains critères (d’où la partie heuristique dans le mot).

Les méta-heuristiques ignorent complètement le problème étudié, considérant que l’heuristique recherchée est juste une fonction qui doit être optimisée pour minimiser un critère. Ainsi, la même méta-heuristique peut être utilisée pour produire des heuristiques qui répondent à un très grand nombre de problèmes.

Certaines des méta-heuristiques les plus connues sont les colonies de fourmis, les algorithmes génétiques, le recuit simulé, etc.

Pour aller au-delà

Un article sur les colonies de fourmis.

Les colonies de fourmis visent à reproduire le comportement des fourmis pour trouver un chemin le plus court dans un graphe.
The Traveling Salesman Problem: When Good Enough Beats Perfect.

Une vidéo sur le TSP et quelques heuristiques pour approximer sa solution.
Page Wikipedia sur les méta-heuristiques.

Si vous souhaitez en apprendre davantage à leur sujet.