IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

SQL Server - Trop d’index tue l’index : supprimez les index inutiles !

Pour réagir au contenu de cet article, un espace de dialogue vous est proposé sur le forum. 8 commentaires Donner une note à l´article (5)

Article lu   fois.

L'auteur

Profil ProSite personnel

Liens sociaux

Viadeo Twitter Facebook Share on Google+   

I. L’auteur

II. Introduction

Image non disponible

Je découvre souvent beaucoup trop d’index dans les bases de données des clients que j’audite… Or, tout index coûte en mise à jour, et chaque mise à jour étant « bloquante », cela pèse sur les performances. Il faut donc supprimer ou désactiver les index inutiles. Cet article propose une méthode pour analyser base, par base les index à supprimer… Attention, il existe de nombreux pièges dans lesquels il ne faut pas sombrer… D’où l’intérêt d’un tel article !

Un index n’est autre qu’un moyen destiné à accélérer certaines recherches. Une définition stricte de l’index est la suivante :

structure de données redondantes
spécialement organisée
pour accélérer certaines recherches

C’est une structure de données qui diffère de la table. Dans une table, les lignes sont « désordonnées », elles y sont mises où il y a de la place sans aucun ordre particulier. Dans un index, les informations sont placées en fonction de l’algorithme choisi pour l’index (BTree, Hash, Columnar…).

Redondante, car il y a copie des données pour construire l’index. Un index prend donc de la place et cette place va immanquablement rejaillir sur la maintenance : défragmentation, recalcul des statistiques, sauvegarde, restauration, duplication dans la cadre d’une haute disponibilité…

Spécialement organisées, car en sus de la copie et de l’arrangement des informations, on y trouve des éléments complémentaires pour aider à rechercher rapidement l’information. La plupart du temps, il s’agit d’arbres de recherche (donc des informations supplémentaires qui aiguillent vers la donnée finale recherchée) ou bien de calcul de transformation (par exemple hachage).

Accélérer certaines recherches : oui, car toutes les recherches avec tous les opérateurs disponibles du SQL (<, <=, <>, >, >=, =, IN, BETWEEN, LIKE…) ne peuvent pas bénéficier de l’accélération liée à l’index. C’est la notion de « cherchabilité » (en anglais « sargable » néologisme venant de Search ARGument ABLE) qui signifie « apte à utiliser l’argument de recherche ». Par exemple aucun index ne permet de rechercher rapidement une forme comme :

COLONNE <> valeur

En effet, une telle recherche est une « non » recherche en ce sens que l’on veut tout sauf telle valeur…

III. Trop d’index tue l’index

Les index sont utilisés automatiquement par l’optimiseur de SQL Server qui décide en analysant des statistiques si l’utilisation d’un index est préférable à la lecture de la table (parfois la lecture de la table est gagnante par rapport à l’utilisation de l’index, tout dépend des conditions de filtrage). En présence de nombreux index, l’analyse consiste à étudier chacun des index candidats et d’évaluer quel sera le meilleur gain pour chacun d’eux. Un index est candidat si au moins l’une des colonnes composant l’index est visée par au moins l’une des clauses WHERE, HAVING ou ON (du JOIN), voire parfois pour les clauses GROUP BY et ORDER BY.

Or, trouver un plan d’exécution optimal, dont la recherche est dévolue à l’optimiseur, est un sport de haut niveau qui requiert « intelligence » et rapidité… Intelligence, car il faut évaluer de nombreuses conditions complexes avec des mesures de coût très particulières (nombre estimé de lignes scrutées, nombre estimé de lignes rapportées, tailles des lignes, coût d’exécution de chaque opération…) et rapidité, car il ne servirait à rien de mettre plus d’une minute pour trouver un plan d’exécution parfait, si une solution triviale d’une banalité effrayante mettait moins de 10 secondes pour exécuter la requête…

Il y a donc un temps imparti pour que l’optimiseur de SQL Server trouve un plan, qui ne sera pas forcément parfait, mais déjà bien affiné… Cependant, en présence de trop nombreux index, l’optimiseur va perdre du temps à analyser trop de combinaisons et peut-être ne pas trouver ce fameux plan optimal !

IV. Trouver les index inutiles

SQL Server permet, à l’aide de la DMV sys.dm_db_index_usage_stats, de trouver les index qui n’ont fait l’objet d’aucun accès en lecture. C’est une vue dont le périmètre est tout le serveur (elle scrute les données à travers toutes les bases).

Les mesures d’accès sont rassemblées en trois colonnes :

  • user_seeks : recherche d’une valeur dans l’index ;
  • user_lookups : recherche de valeurs multiples dans l’index ;
  • user_scans : lecture séquentielle des lignes de l’index.

Lorsque ces trois colonnes sont à 0, l’index n’est jamais accédé en lecture. Il semble donc inutile…

V. Inutile, mais sans danger !

Mais… il n’est pas utile et même dangereux de supprimer tous les index inutiles ! En effet, lorsqu’une table est vide, ces index sont vides aussi. Problème, cette table actuellement vide peut se remplir un jour ou l’autre… Et sans doute y aura-t-il besoin de ces index à ce moment. Or, en aucun cas ces index ne constituent un problème, car un index vide ne coûte rien !

Il existe d’autres cas pour limiter la suppression des index inutiles :

l’index hypothétique : c’est en fait une indication d’index sans aucun stockage des valeurs de l’index, mais doté de statistiques pour aider l’optimiseur. Le supprimer serait contre-productif pour l’optimisation des requêtes.

l’index unique ou de clef primaire : à l’évidence il ne faut pas modifier la structure de la base. L’éditeur de logiciel qui en serait victime aurait parfaitement raison de râler, car les données pourraient être logiquement corrompues.

La table : les index d’identifiant 0 et 1 sont en fait la table ! Inutile de dire que supprimer une table de la base serait encore plus dangereux…

VI. La profondeur de scrutation

Enfin, un élément déterminant de cette analyse est la profondeur de scrutation des statistiques fournies par les DMV… En effet, la vue de gestion sys.dm_db_index_usage_stats, comme toutes ses petites sœurs, est vidée à chaque démarrage du service SQL Server de l’instance. Si vous l’utilisez juste après un redémarrage, vous constaterez que la plupart des index sont inutiles… Tout simplement par ce que pas encore utilisés !

Il faut donc que l’instance SQL Server ait accumulé suffisamment de statistiques… Or, en dehors des opérations effectuées au fil de l’eau, certains traitements sont journaliers, d’autres hebdomadaires, quelques-uns mensuels, parfois trimestriels et enfin annuels (clôture de bilan par exemple). Pour ma part, je considère que la rémanence des informations de ces DMV doit au moins avoir 31 jours de recul… En deçà, danger !

On peut se servir de la requête suivante pour connaître de la profondeur d’analyse en jours après le dernier redémarrage de l’instance :

SELECT DATEDIFF(day, sqlserver_start_time, GETDATE()) AS RUN_DAYS FROM sys.dm_os_sys_info

VII. Finalement

Toutes ces considérations se résument dans la requête suivante :

 
Sélectionnez
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
SELECT -- which table :
       s.name AS TABLE_SCHEMA, o.name AS TABLE_NAME, 
       -- which index, how many UPDATES
       i.name AS INDEX_NAME, ius.user_updates,
       -- stats on recoverable pages for index
       (SELECT SUM(used_page_count)  
        FROM   sys.dm_db_partition_stats AS ps 
        WHERE  ps.object_id = ius.object_id 
          AND  ius.index_id = ps.index_id) 
          AS INDEX_USED_PAGE,
       -- stats on recoverable pages for the all DB
       SUM((SELECT SUM(reserved_page_count) AS P 
            FROM   sys.dm_db_partition_stats AS ps 
            WHERE  ps.object_id = ius.object_id 
              AND  ius.index_id = ps.index_id)) OVER() 
          AS DB_USED_PAGES,
       -- build the ALTER INDEX SQL command
       N'ALTER INDEX [' + i.name + '] ON [' + s.name
         + '].[' + o.name + '] DISABLE;' AS SQL_INDEX_DISABLE,
       -- build the ADROP INDEX SQL command
       N'DROP INDEX [' + i.name + '] ON ['
         + s.name + '].[' + o.name + '];' AS SQL_INDEX_DROP
FROM   sys.dm_db_index_usage_stats AS ius
       JOIN sys.objects AS o 
          ON ius.object_id = o.object_id
       JOIN sys.schemas AS s 
          ON o.schema_id = s.schema_id
       JOIN sys.indexes AS i 
          ON ius.object_id = i.object_id AND
             ius.index_id = i.index_id
WHERE  ius.index_id > 1             -- ignore tables
  AND  i.is_hypothetical = 0        -- ignore hypothetical indexes
  AND  i.is_primary_key = 0         -- ignore PK
  AND  i.is_unique = 0              -- ignore AK
  AND  i.is_unique_constraint = 0   -- ignore unique indexes
  AND  user_seeks = 0               -- index has no seek
  AND  user_lookups = 0             -- index has no lookup
  AND  user_scans = 0               -- index has no scan
  AND  database_id = DB_ID()        -- only for current DB
  -- ignore empty index (empty table ?)
  AND  EXISTS(SELECT * 
              FROM   sys.dm_db_partition_stats AS ps 
              WHERE  ps.object_id = ius.object_id 
                AND  ius.index_id = ps.index_id 
                AND  row_count > 0) 
  -- ignore the diagnosis if statistics persistence < 31 days
  AND  EXISTS(SELECT *
              FROM   sys.dm_os_sys_info
              WHERE  sqlserver_start_time 
                     <= DATEADD(day, -31, GETDATE()))
ORDER BY 1, 2, 3;

VIII. Remerciements Developpez.com

Nous tenons à remercier escartefigue pour la relecture orthographique de cet article, et Malick pour la mise au gabarit.

Vous avez aimé ce tutoriel ? Alors partagez-le en cliquant sur les boutons suivants : Viadeo Twitter Facebook Share on Google+   

Copyright © 2022 Frédéric BROUARD. Aucune reproduction, même partielle, ne peut être faite de ce site ni de l'ensemble de son contenu : textes, documents, images, etc. sans l'autorisation expresse de l'auteur. Sinon vous encourez selon la loi jusqu'à trois ans de prison et jusqu'à 300 000 € de dommages et intérêts.