Les SIG

Introduction

Dans cet article, qui inaugure une nouvelle catégorie, nous n’allons pas parler directement de géologie (sacrilège). Nous allons en effet nous intéresser à des outils numériques qui permettent d’étudier et de traiter des données de terrain depuis son ordinateur. Comme dans tous les domaines des sciences modernes, les outils numériques prennent une place de plus en plus importante dans la recherche en sciences de la Terre. Les SIG permettent grâce à de nombreux logiciels de traiter des données géoréférencées dans le monde entier. Je suis personnellement très intéressé par ce genre d’approche informatique des sciences. Voici donc une introduction très succincte aux SIG et aux possibilités qu’ils offrent !

Qu’est-ce qu’un SIG ?

Il est possible que la plupart d’entre vous n’ai jamais entendu parler de SIG. J’avoue que je ne connaissais pas ce sigle avant d’avoir des cours à ce sujet lors de mon année de L3. SIG signifie « Système d’Information Géographique ». N’étant pas certain que cela vous aide beaucoup à comprendre ce qu’est un SIG, je vais vous donner une définition simple qui correspond à peu près à celle que l’on m’a donnée en cours. Un SIG est un ensemble informatique permettant de traiter et de représenter des données cartographiques dans un espace géoréférencé. De nombreux logiciels permettent de faire du SIG, le plus utilisé (notamment car il est gratuit, régulièrement mis à jour et que n’importe qui peut ajouter des outils via des extensions) étant Qgis.

L’interface de Qgis. Ce logiciel gratuit est relativement simple à prendre en main une fois que l’on a compris les bases du SIG. La boîte de gauche permet de visualiser toutes les couches que l’on a chargées ou créées sur le projet et de choisir lesquelles afficher à l’écran

Systèmes de coordonnées

Si vous avez à peu près compris la définition ci-dessus, il ne vous aura pas échappé qu’une notion est primordiale en SIG : le géoréférencement, la localisation des données dans l’espace. Il est donc nécessaire d’utiliser des systèmes de coordonnées permettant de localiser très précisément les données que l’on traite. Il existe de nombreux systèmes de coordonnées que l’on appelle des SCR, des « Système de Coordonnées de Référence » (oui, il y a beaucoup de sigles en SIG). Il existe différents types de SCR, se basant chacun sur un ellipsoïde de référence défini. Pour faire très simple (voir grossier), un ellipsoïde de référence est une modélisation approchée de la surface de la Terre. Les SCR peuvent utiliser différents types de projection (c’est-à-dire une représentation en 2D d’un espace en 3D) : coniques, cylindriques, elliptiques ….

Exemple de plusieurs types de projections cartographiques
Source : dane.ac-lyon.fr

En France, le SCR officiel est le Lambert-93, qui est une projection conique conforme. Il est utilisé pour toutes les données géoréférencées en métropole. Les coordonnées (latitude et longitude) sont exprimées en mètres. Par exemple, les coordonnées de la statue de Vercingétorix place de Jaude, à Clermont-Ferrand sont 6 519 726 m Nord et 706 368 m Est. A l’échelle du monde, le SCR le plus souvent utilisé est le WGS 84. Les coordonnées sont angulaires : 45,777° Nord et 3,082° Est pour la statue de Vercingétorix.

Le nombre de SCR existant étant très élevé, ils sont regroupés dans des listes qui leurs attribuent un code spécifique pour les retrouver plus facilement. Le code le plus utilisé est l’EPSG (European Petroleum Survey Groupe, du nom du groupe à l’origine de cette liste). Le code EPSG du Lambert-93 est le 2154, celui du WGS 84 est le 4326. De nombreux logiciels de SIG tels que Qgis utilisent ce code.

Données raster et vecteur

Les logiciels de SIG peuvent traiter deux grands types de fichiers : les fichiers rasters et les fichiers vecteurs. Ceux-ci ne sont pas utilisés de la même façon.

Les fichiers rasters sont des « images ». Un fichier de ce type est en effet composé d’une matrice de pixels. Chaque pixel contient une valeur numérique correspondant à une information : couleur (photos par exemple), altitude, précipitations, pentes … Ce type de format est donc particulièrement utile pour traiter des variables continues (c’est-à-dire des variables pouvant potentiellement prendre un nombre illimité de valeurs dans l’espace). Un type de raster très courant est le MNT (Modèle Numérique de Terrain). Un MNT est une représentation de la topographie. Chaque pixel contient une valeur d’altitude. Il est possible de calculer de nombreux autres fichiers rasters à partir d’un MNT : les pentes, leur exposition … Nous verrons dans le prochain article consacré au SIG comment les MNT peuvent être produits. Le format le plus utilisé pour les fichiers rasters est le GeoTiff.

Les fichiers vecteurs sont des formes géométriques (points, lignes ou polygones) auxquelles sont associées des informations contenues dans une « table d’attributs », c’est-à-dire un tableau regroupant les informations propres à chaque objet : coordonnées, surface, nom, occupation des sols … Ce type de format est donc particulièrement adapté pour traiter des variables discrètes (c’est-à-dire des variables pouvant prendre un nombre limité de valeurs dans un espace bien défini). L’avantage de ce format est de pouvoir contenir des informations très diversifiées pour un même objet grâce à sa table d’attributs. Il peut servir à délimiter des communes, à représenter la carte géologique ou pédologique (des sols) … Le format le plus utilisé (mais qui tend à être remplacé car il est en réalité peu pratique) est le shapefile.

Récupérer des données

Il existe une quantité phénoménale de données rasters ou vectorielles pouvant être récupérées gratuitement sur internet.

En France, le principal fournisseur de données est l’IGN (Institut Géographique National, aujourd’hui nommé Institut national de l’information géographique et forestière). Des données vectorielles et rasters sont disponibles au téléchargement sur leur site pour chaque département de métropole et d’outre-mer. De nouvelles données sont régulièrement ajoutées, l’IGN devant rendre public toutes les données qu’il produit. Les MNT à 1 m (chaque pixel correspond à une zone d’un mètre de côté) sont par exemple disponibles depuis peu. Le principal problème avec l’IGN est que les données disponibles sont parfois difficilement téléchargeables ou utilisables, il est donc parfois nécessaire de passer par d’autres adresses.

Il existe bien d’autres sites où récupérer des données gratuitement. La plupart du temps, cela nécessite seulement de créer un compte à partir d’une adresse mail. Pour terminer, parlons rapidement de deux autres sites que j’utilise parfois. Tout d’abord, le projet européen Sentinel-2 utilise une constellation de satellites qui prennent des images dans différentes longueurs d’ondes (lumière visible, infrarouges …). Cela permet notamment de faire de la télédétection, nous y reviendrons également dans le prochain article consacré aux SIG. Un autre site utile est Natural Earth, qui permet de récupérer des fichiers rasters et vecteurs à l’échelle du monde (ils peuvent servir de jolis fonds de carte).

Juste pour le plaisir, la chaîne des Puys et la faille de la Limagne parfaitement visibles sur le MNT ombré à 25 m du Puy-de-Dôme

Nous allons nous arrêter ici pour cette brève introduction au monde des SIG ! J’espère que cela vous a intéressé. Si vous aimez les cartes, n’hésitez pas à télécharger Qgis et à vous amuser, de nombreux tutoriels d’introduction sont disponibles un peu partout. Le meilleur moyen de se faire la main reste cependant de gratter le logiciel par soi-même et d’explorer les différents outils. Nous reviendrons sur ce sujet une prochaine fois en allant un peu plus loin. Nous aborderons les techniques de création d’un MNT et nous verrons quelques exemples d’utilisation des SIG en sciences de la Terre et de l’Environnement.