Réaliser le potentiel :

Exploiter les données non structurées au moyen de grands modèles de langage

^{Octobre 2023}

L’industrie de l’assurance connaît bien les données; elle en tire profit. Pourtant, une partie importante de ces données est non structurée et est confinée dans des documents comme les rapports du médecin traitant. Cependant, cela change rapidement. Les grands modèles de langage sont devenus une technologie accessible capable de libérer ces réserves de données et de fournir des renseignements et des perspectives auparavant difficiles d’accès.

Dans cette série d’articles, nous verrons le fonctionnement de ces modèles, nous nous pencherons sur les cas d’utilisation probables dans le cadre de la sélection des risques et des réclamations, et nous examinerons les facteurs dont les assureurs doivent tenir compte dans l’élaboration de leurs stratégies d’intelligence artificielle

Grands modèles de langage : Notions de base

Nous avons tous entendu parler de Chat GPT : c’est le grand modèle de langage le plus célèbre. Qu’est-ce que cela signifie exactement? Un grand modèle de langage est un type de modèle de traitement du langage naturel et génératif qui peut accomplir diverses tâches, notamment générer et classer du texte, répondre aux questions de façon conversationnelle et traduire du texte d’une langue à une autre.

Les grands modèles de langage convertissent de vastes quantités de données, comme des articles et des wikis, en encodages à partir desquels ils peuvent être entraînés pour comprendre le contexte. Le terme « grand » fait référence au nombre de valeurs (paramètres) pouvant faire l’objet d’un entraînement. Le modèle de langage peut aussi tirer des leçons de la rétroaction humaine dans le cadre d’un processus appelé apprentissage par renforcement à partir de rétroaction humaine. Certains des modèles les plus réussis, comme Chat GPT-3, ont des centaines de milliards de paramètres qui ont été entraînés sur l’équivalent de 600 000 livres de données et de rétroaction de plusieurs centaines de personnes.

La capacité des grands modèles de langage à générer du texte pertinent en prédisant le prochain mot viable (ou jeton pour être précis) dans une phrase les place dans une catégorie d’algorithmes d’intelligence artificielle connue sous le nom d’intelligence artificielle générative.

Graphic image explaining what a Large Language Model is

Travailler comme notre cerveau

Ils sont basés sur une architecture appelée un transformateur qui, à la base, possède un énorme réseau de neurones artificiels, essentiellement un modèle de traitement de l’information qui reproduit le fonctionnement de notre cerveau. Les réseaux de neurones artificiels ont été inspirés par les neurones biologiques. Dans celles-ci, l’information est stockée dans la force des connexions dans les synapses. Ces connexions évoluent et s’ajustent continuellement à mesure que nous traitons l’information et apprenons. Il en va de même pour les réseaux neuronaux artificiels. Leurs données sont stockées dans des coefficients synaptiques qui définissent la force des connexions entre les neurones artificiels. Pendant l’entraînement, ces coefficients, qui commencent par des nombres aléatoires, sont continuellement ajustés jusqu’à ce que l’erreur de sortie sur réseau soit très faible.

Technologies révolutionnaires

Le domaine de l’intelligence artificielle existe depuis des années, mais les récentes percées ont permis de réaliser des progrès révolutionnaires à une vitesse vertigineuse. Nous disposons maintenant de technologies informatiques plus avancées, d’unités de traitement graphique qui nous permettent de nous entraîner en utilisant beaucoup plus de données. De plus, le développement du modèle de transformateur, inventé par Google en 2017, a entraîné un changement de paradigme du grand modèle de langage.¹ Au lieu de traiter une entrée comme une phrase, un mot à la fois, les modèles de transformateur traitent toutes les entrées en même temps. Cette façon améliore la capacité du modèle à mieux reconnaître le contexte et accélère l’entraînement. Ensemble, les unités de traitement graphique et l’architecture du transformeur permettent à un grand modèle de langage d’apprendre à comprendre et à générer un langage pertinent.

Préentraînement et mise au point

Plus récemment, les grands modèles de langage, comme Chat GPT-4, ont reçu un préentraînement (à partir de zéro) sur au moins 1 pétaoctet de données. C’est l’équivalent de lire un milliard de livres. Compte tenu de la quantité de données et de matériel requis, il peut être coûteux d’entraîner de grands modèles de langage. Il existe heureusement des solutions de rechange pour réduire les coûts. Un exemple est la mise au point, qui consiste à ajuster et à adapter un modèle préentraîné pour répondre à un besoin précis. Par exemple, un assureur pourrait appliquer ses propres données à un modèle qui a déjà fait ses preuves pour faire la mise au point dans le but de produire une recommandation en matière de sélection des risques.

La méthode la moins coûteuse pour personnaliser un grand modèle consiste à ajouter un système de récupération de l’information pour améliorer les données disponibles dans le modèle sur un sujet particulier. C’est ce qu’on appelle la récupération de la génération augmentée, ou RAG. C’est ce qui nous permet, par exemple, d’extraire et de traiter des renseignements d’un rapport du médecin traitant. Les architectures RAG sont à la fois efficaces et rentables pour les cas d’utilisation de traitement de l’information précise à grande échelle.

Principales forces du grand modèle de langage

Les grands modèles de langage sont propulsés par de vastes réseaux de neurones artificiels et sont des systèmes d’intelligence artificielle sophistiqués qui offrent un éventail d’occasions intéressantes aux compagnies d’assurance vie et d’assurance invalidité, notamment :

Synthétisation des données non structurées : ces modèles excellent à extraire des informations de sources disparates et à regrouper des données pour une analyse efficace.
Personnification de l’information : ils offrent une façon novatrice d’interagir avec les données non structurées, ce qui les rend plus accessibles et exploitables.
Avantage concurrentiel : les sociétés qui disposent de données exclusives, propres à un domaine et non structurées (p. ex., données sur la sélection des risques médicaux) auront une longueur d’avance en tirant parti du potentiel inexploité de leurs réserves de données.

Rendre l’intégration des grands modèles de langage viable

Bien que le potentiel de ces modèles soit attrayant, les assureurs doivent tenir compte de certains aspects pratiques pour assurer la réussite de la mise en œuvre. Les deux éléments les plus importants sont le coût et la technologie.

La rentabilité de l’intégration des grands modèles de langage dépend en grande partie de l’approche d’entraînement choisie. Les assureurs doivent évaluer leurs cas d’utilisation précis pour déterminer la stratégie la plus efficace. L’entraînement des grands modèles de langage peut être coûteux, mais il existe des solutions de rechange pour atténuer les dépenses et des techniques comme la mise au point et la RAG peut optimiser le processus. Une gestion prudente des coûts de l’infonuagique est également essentielle, car des dépenses importantes pourraient s’accumuler si elles ne sont surveillées avec diligence. Étant donné que des ensembles de données bien organisés sont essentiels à l’exactitude et au rendement des modèles, les assureurs doivent également tenir compte des coûts des ressources associés à la création d’ensembles de données pour l’entraînement de ces modèles.

Les grands modèles de langage ont besoin de matériel informatique approprié, en particulier les unités de traitement graphique, pour l’hébergement et l’inférence (c.-à-d. pour générer des sorties de texte). Les assureurs doivent évaluer leur infrastructure informatique et investir en conséquence. Le choix entre utiliser des services infonuagiques ou investir dans du matériel spécialisé est crucial. Cette décision doit tenir compte des objectifs à long terme et des contraintes budgétaires.

Avantages énormes

Tirer parti de la puissance des grands modèles de langages n’est pas sans défis, mais les avantages pourraient être énormes. En adoptant ces modèles, les assureurs peuvent transformer des données non structurées en renseignements exploitables, ce qui peut améliorer la prise de décisions, l’évaluation des risques et le service à la clientèle.

Ils doivent évaluer attentivement les facteurs de coût et les choix technologiques pour faire de l’intégration des grands modèles de langage dans leurs processus opérationnels un objectif viable. Ceux qui adoptent cette technologie transformatrice pourraient se retrouver à l’avant-garde de l’innovation dans le secteur de l’assurance vie et de l’assurance invalidité, être mieux outillés pour répondre aux besoins changeants de leurs clients et s’y retrouver dans le contexte complexe de l’assurance moderne.

Prochain article : Utiliser de grands modèles de langage pour la sélection des risques et les réclamations fondées sur l’intelligence artificielle.