L'apprentissage automatique fournit une aide importante pour la modélisation des dispositifs expérimentaux.
L'apprentissage machine (ML, pour Machine Learning en anglais) est devenu un pilier important de la science des matériaux. Il a aidé la communauté dans différents domaines tels que l'analyse des propriétés des matériaux, l'analyse des nanomatériaux, la découverte de nouveaux matériaux, la découverte et la conception de médicaments et la chimie quantique. Il est utilisé dans différents secteurs manufacturiers qui traitent de diverses industries fondées sur la chimie, allant de la conception et de la fabrication de l'électronique aux gadgets quotidiens.
Une collaboration entre un maître de conférences au laboratoire des couches minces du département de physique de la faculté des sciences de l'université du canal de Suez et un assistant de recherche du centre de recherche Wigner pour la physique a montré l'importance du ML comme outil pour réduire le coût de l'expérimentation avec différents paramètres. Ils ont utilisé le dianhydride 1,4,5,8-naphtalène-tétracarboxylique (NTCDA) car il présente de nombreuses qualités favorables pour le développement de semi-conducteurs organiques.
Une photodiode
L'architecture de la photodiode organique fabriquée, telle que présentée sur la figure 1, se présente sous la forme de Au/NTCDA/p-Si/Al. Leur étude présente une hétérojonction hybride fondée sur NTCDA/p-Si pour des applications de photodétection.
Fig. 1 : (a) Architecture de la photodiode fabriquée, et (b) structure moléculaire du NTCDA.
Différentes techniques de modélisation ont été utilisées dans cette étude pour reproduire la courbe I-V du dispositif fabriqué. Par conséquent, la tension et l'intensité incidente de la lumière - comme indiqué dans la figure d'ouverture - ont été utilisées comme caractéristiques principales pour les modèles de ML et le courant prédit est utilisé pour être comparé aux données mesurées expérimentalement, c'est-à-dire le courant de sortie de la photodiode fabriquée.
Explorer plus de possibilités avec les modèles
Ceci a permis aux chercheurs de vérifier l'exactitude de leurs modèles et d'explorer également différents paramètres d'expérimentation - puisque les modèles peuvent généraliser suffisamment bien - sans avoir besoin de refabriquer le dispositif dans des conditions différentes ou de répéter l'expérimentation pour vérifier la réponse de la photodiode à une certaine tension et à une intensité lumineuse spécifique.
Les résultats expérimentaux montrent que selon les valeurs obtenues de la réactivité spectrale, de la gamme linéaire-dynamique, de la détectivité spécifique, du rapport signal/bruit et du temps de réponse pour la photodiode sous l'influence de la lumière UV d'intensité 20 - 80 mW/cm2, le dispositif actuel est suggéré pour de nombreuses applications optoélectroniques, en particulier pour détecter la manière de détecter la lumière UV. Ces résultats obtenus assurent que l'intensité lumineuse optimale - où ce détecteur fonctionne efficacement - est de 50 mW/cm2.
Comparatif des modèles
Les quatre modèles utilisés dans cette étude sont K-Nearest Neighbor, l'approche AutoML fondée sur le frameworkTPOT, le Feed Forward Neural Network et un Continuous Variable Quantum Neural Network. Les auteurs ont exploré différents modèles pour documenter le parcours du pipeline ML des quatre modèles et indiquer lequel est le plus adapté en fonction de la cible finale et des ressources disponibles.
Dans le tableau 1, on voit que les quatre modèles ont réussi à obtenir de très bonnes performances sur le jeu de données de test parce que les auteurs ont traité le problème de modélisation comme un problème de régression plutôt que comme une procédure d'ajustement. Le tableau reflète le comportement naturel du KNN et du pipeline ML résultant de TPOT puisque l'erreur d'apprentissage est de 0.
Le FNN, ou réseau de neurones artificiel (ANN) a réussi à être le meilleur modèle parmi les autres modèles ML. Le QNN, bien qu'il ait le plus petit ensemble de paramètres réglables, seulement 40, et un seul mode quantique (Qumode) a réussi à concurrencer le FNN avec plus de 1 000 paramètres entraînables, et à converger plus rapidement.
Modèle | Entraînement | Test | Validation | Utilisabilité |
KNN | 0 | 2.67.10-11 | 6.07.10-11 | Moyen |
TPOT | 0 | 3.58.10-11 | 5.38.10-11 | Facile |
ANN | 2.382.10-11 | 1.0897.10-11 | - | Dur |
QNN | 1,2655.10-10 | 9.695.10-11 | - | Très dur |
Tableau 1 : Les valeurs de perte ou d'erreur quadratique moyenne pour chaque modèle et l'utilisabilité relative de chaque méthode en fonction des connaissances requises pour que chacune soit développée correctement.
Le modèle le plus pratique
La colonne d'utilisabilité indique l'expérience relative requise pour que quiconque puisse développer de tels modèles. En termes de développements logiciels pratiques, la méthode TPOT est la plus facile à utiliser car elle ne nécessite que d'avoir des connaissances de base en programmation logicielle et une solide compréhension des différentes métriques et critères d'ajustement. Le reste est entièrement automatisé par son API interne.
Le modèle KNN nécessite une solide compréhension des bases du ML et de la façon de préparer les données pour un tel algorithme fondé sur la distance. Les deux derniers algorithmes nécessitent un niveau expert notamment le modèle QNN. En termes de critères d'ajustement purs, nous recommandons le modèle KNN - avec un nombre plus élevé de k-folds pour le réglage des hyperparamètres - comme étant le modèle à privilégier dans ce genre de situation.
L'importance de l'apprentissage automatique
Il est intéressant de mentionner que les auteurs ont utilisé un état Displaced Squeezed pour coder les caractéristiques classiques pour le QNN et seulement 8 couches comme le montre la figure 2.
Fig. 2 : La configuration du circuit quantique utilisé pour la modélisation. Les portes groupées représentent une seule couche du QNN. La boîte en pointillés est répétée 8 fois. Le 'r' dans la préparation de l'état représente la magnitude de la porte d'écrasement et α est la magnitude du déplacement.
Cette étude suggère fortement l'importance d'utiliser des techniques d'apprentissage automatique et surtout d'utiliser l'informatique quantique dans les simulations de la science des matériaux. De plus, elle a pratiquement prouvé l'universalité du QNN à variables continues dans un problème de régression.
D'autre part, la photodiode organique fabriquée s'est révélée très utile et résiliente dans différents contextes. Le domaine des semi-conducteurs organiques a encore beaucoup à nous donner et les auteurs pensent que la meilleure façon de le dynamiser est d'utiliser le ML pour accélérer le processus de développement.
Ahmed M. El-Mahalawy, Ph.D., Laboratoire des couches minces, Département de physique, Faculté des sciences, Université du canal de Suez, Ismaïlia, Égypte, et Kareem H. El-Safty, Centre de recherche Wigner pour la physique, Budapest, Hongrie
Cet article a d'abord été publié par la Lettre d'information de la physique africaine - © American Physical Society, 2021. Traduction en français par Afriscitech.