Les méthodes chimiométriques locales, une solution pour les « big data NIR »

Les méthodes chimiométriques locales, une solution pour les « big data NIR »

La spectroscopie proche infrarouge (ou NIR pour « near-infrared ») est très répandue dans de nombreux domaines en raison de sa rapidité, son approche non destructrice, sa viabilité environnementale et sa simplicité. La nouvelle technologie NIR, plus accessible, favorise l'intégration croissante des spectres proches infrarouges à l’univers des « big data ».

Parmi les dernières améliorations, mentionnons l’utilisation d’instruments portatifs permettant de recueillir des données hors des laboratoires et les systèmes d’imagerie qui facilitent la collecte d’un volume encore plus important de données. L’objectif est d’utiliser ces vastes jeux de données NIR de façon plus efficace et rapide : les utilisateurs accéderont aux données via un cloud en ligne. Dans ce cadre, le défi consiste à offrir un service de prédiction rapide et précis à l’aide du cloud tout en protégeant les données brutes. Au CRA-W, en collaboration avec plusieurs instituts étrangers, différents outils chimiométriques «locaux » appliqués aux données NIR ont été proposés afin d’accélérer les processus de modélisation et de prédiction (régression des moindres carrés partiels locale, Local Partial Least Squares – LPLS et régression des moindres carrés partiels locale avec indices, Local Partial Least Squares using Scores – LPLS-S). Ces approches « locales » ont été testées sur des jeux de données réels et comparées à la méthode de régression des moindres carrés partiels globale classique. Les études portaient sur la quantification des paramètres caractéristiques de qualité des semences de maïs et la prédiction de la teneur totale en β-carotène de racines de manioc.

   Dans tous les cas, ces stratégies ont apporté la preuve de leur efficacité en tant que solution de remplacement des modèles globaux classiques pour optimiser les prédictions. Les résultats ont montré que les approches « locales » pouvaient résoudre le problème de non-linéarité tout en permettant une réduction drastique de la durée de calcul sans pour autant que la précision de leur prédiction s’en trouve diminuée.

Ces méthodes permettent non seulement d’obtenir des prédictions quantitatives plus facilement qu’avec les méthodes de régression classique, mais aussi d’étendre la prédiction à plusieurs produits à partir d’un seul et unique jeu de données. En d’autres termes, la bibliothèque spectrale peut comprendre plusieurs produits, ce qui favorise également le calcul de prédictions uniques en économisant le temps et les efforts nécessaires pour concevoir et maintenir des modèles d’étalonnage individuels. Dernier aspect, mais non le moindre, les méthodes proposées fonctionnent non pas avec les spectres NIR originaux, mais avec des données compressées, assurant ainsi la protection des données brutes.

Partagez cet article
Sur le même sujet