Cours de Géostatistique
Cours de Géostatistique
L'ingénieur géologue est souvent confronté à des masses considérables de données. La plupart du temps plusieurs variables (attributs, caractères) ont été mesurées pour chaque observation. L'étude individuelle de ces variables, bien qu'essentielle, ne permet pas de retirer toute l'information désirée de ce tableau de données. Les méthodes bivariables, en particulier les diagrammes binaires (scatterplots en anglais), sont déjà beaucoup plus riches d'informations puisqu'elles permettent d'établir des relations entre les variables. Les méthodes multivariables vont un peu plus loin et cherchent les relations simultanées entre plusieurs variables. Ces méthodes ne sont pas le propre des ingénieurs géologues; elles peuvent servir à analyser les données de toute provenance. Elles ont été développées tout au long du 20e siècle par des statisticiens et des chercheurs provenant surtout des domaines suivants: sciences sociales, psychologie, sciences biologiques et agriculture.
L'analyse des données vise donc essentiellement à décrire les liens entre les variables et les observations de notre matrice de donnée. Plus précisément, voici une série de questions auxquelles ces méthodes tenteront de fournir des réponses:
i. Peut-on prédire le comportement d'une variable à partir d'une ou plusieurs autres variables (problème de régression)? Quelle est la meilleure équation de prédiction?
ii. Peut-on identifier, voir interpréter, des facteurs pouvant expliquer les variations observées dans les différentes variables (analyse factorielle)?
iii. Peut-on filtrer de nos données l'effet dû à des facteurs indésirables (analyse factorielle)?
iv. Peut-on identifier les différences existant entre divers groupes parmi nos données (analyse discriminante)? Comment utiliser ces différences pour prédire le groupe auquel appartient une nouvelle observation?
v. Quelles sont les observations (ou les variables) ayant des ressemblances au niveau de leur comportement (classification automatique)?
En géologie, contrairement à plusieurs autres domaines, ces variables sont habituellement mesurées en un point précis de l'espace. Certaines de ces variables peuvent être autocorrélées spatialement (rappelez-vous vos notions de géostatistique acquises en géologie minière) de sorte que l'échantillon ne peut être considéré comme étant constitué d'observations indépendantes d'une même population. Cet état de fait impose la nécessité de précautions supplémentaires lors du prélèvement de l'échantillon. En effet si l'on veut que les descriptions de notre échantillon aient quelque pertinence que ce soit en regard de la population, il conviendra d'obtenir un échantillon spatialement le plus homogène possible. On évitera en particulier les sur-représentations de zones géographiques, de types de roches, etc...Signalons au passage que d'autres méthodes (e.g. géostatistique) permettent l'étude des variables spatialement dépendantes. Ces méthodes sont encore du domaine de la recherche et dépassent le cadre de ce cours.
En géologie, contrairement à plusieurs autres domaines, ces variables sont habituellement mesurées en un point précis de l'espace. Certaines de ces variables peuvent être autocorrélées spatialement (rappelez-vous vos notions de géostatistique acquises en géologie minière) de sorte que l'échantillon ne peut être considéré comme étant constitué d'observations indépendantes d'une même population. Cet état de fait impose la nécessité de précautions supplémentaires lors du prélèvement de l'échantillon. En effet si l'on veut que les descriptions de notre échantillon aient quelque pertinence que ce soit en regard de la population, il conviendra d'obtenir un échantillon spatialement le plus homogène possible. On évitera en particulier les sur-représentations de zones géographiques, de types de roches, etc...Signalons au passage que d'autres méthodes (e.g. géostatistique) permettent l'étude des variables spatialement dépendantes. Ces méthodes sont encore du domaine de la recherche et dépassent le cadre de ce cours.
Ce cours comporte 04 chapitres:
1 OBJECTIFS DE L'ANALYSE DES DONNÉES
2 PLACE DU COURS DANS LA FORMATION DE L'INGÉNIEUR GÉOLOGUE;
3 PRINCIPALES STATISTIQUES D’UN ÉCHANTILLON
3 PRINCIPALES STATISTIQUES D’UN ÉCHANTILLON
4 PRINCIPAUX PARAMÈTRES D’UNE POPULATION
Commentaires
Enregistrer un commentaire