📋

Points Clés

  • Trois adolescents de 15 ans de Santa Clara, Californie, ont fabriqué des lunettes intelligentes alimentées par l'IA pour moins de 100 $
  • Le prototype convertit le texte en parole en temps réel avec plus de 90 % de précision et un temps de chargement moyen de 13 secondes
  • L'appareil utilise une carte d'ordinateur Raspberry Pi, une caméra, une batterie et des haut-parleurs pour capturer et traiter le texte
  • L'équipe a remporté un prix de 10 000 $ lors du Thermo Fisher Scientific Junior Innovators Challenge
  • Les lunettes ont été entraînées à l'aide de 800 images provenant de manuels scolaires collectées sous trois conditions d'éclairage

Résumé Rapide

Trois adolescents californiens ont développé des lunettes intelligentes alimentées par l'IA qui convertissent le texte en parole pour les étudiants malvoyants. L'appareil coûte moins de 100 $ à fabriquer.

Akhil Nagori, Evann Sun et Lucas Shengwen Yen ont passé cinq mois à créer le prototype. Les lunettes utilisent une carte d'ordinateur Raspberry Pi, une caméra, une batterie et des haut-parleurs pour capturer des images, extraire le texte et diffuser l'audio via les haut-parleurs intégrés.

Les étudiants ont soumis leur projet au Thermo Fisher Scientific Junior Innovators Challenge et ont remporté un prix de 10 000 $. Le concours ne sélectionne que 300 finalistes nationaux parmi environ 2 000 candidats.

Les lunettes atteignent plus de 90 % de précision avec un temps de chargement moyen de 13 secondes. L'équipe a entraîné son logiciel à l'aide de 800 images provenant de manuels scolaires collectées sous trois conditions d'éclairage.

Nagori a également reçu le Thermo Fisher Scientific Leadership Award, tandis que Sun a remporté le Lemelson Foundation Award for Invention. Les étudiants ont reçu une subvention de 5 000 $ pour développer la production et prévoient de distribuer les lunettes dans toute la Californie.

L'Innovation derrière les Lunettes

Trois adolescents de 15 ans de Santa Clara ont créé des lunettes intelligentes de texte à parole alimentées par l'intelligence artificielle. La technologie portable aide les étudiants malvoyants à accéder aux supports de lecture de n'importe quel format.

Le prototype a nécessité cinq mois de développement et a coûté moins de 100 $ à fabriquer. Akhil Nagori a expliqué la motivation derrière le projet : « Notre objectif principal était de créer une méthode simple et économique pour transcrire le texte de n'importe quel format pour les étudiants malvoyants. »

Les lunettes fonctionnent en prenant des photos de texte, en extrayant le contenu et en le convertissant en audio diffusé par de petits haut-parleurs intégrés dans la monture. L'appareil utilise une carte d'ordinateur Raspberry Pi, une caméra, une batterie et des haut-parleurs. Il comprend également un petit interrupteur marche/arrêt.

Les métriques de performance montrent que le prototype atteint plus de 90 % de précision lors de la traduction du texte en parole. Lucas Shengwen Yen a souligné l'importance de la vitesse : « L'un des aspects les plus importants de notre projet est le temps de chargement. Il était en moyenne d'environ 13 secondes. »

L'inspiration est venue d'une expérience personnelle. Nagori s'est rendu en Inde pour rendre visite à sa famille, notamment à son grand-oncle qui est malvoyant et travaille comme caissier. Il a observé : « Il a toutes ces boîtes remplies de reçus en braille. Il doit les parcourir ligne par ligne. Quand j'ai vu ça, j'ai dit : "Il doit y avoir une façon plus simple qui n'est pas si fastidieuse." »

Processus de Développement Technique

Les étudiants ont fait face à trois défis principaux pendant le développement : la conception du matériel, la programmation du logiciel et la collecte de données par le biais de tests.

Conception du Matériel

Evann Sun a dirigé la conception du matériel en utilisant le logiciel de CAO Fusion 360 et une imprimante 3D pour créer des montures personnalisées. L'équipe a recherché les dimensions moyennes des lunettes pour les élèves du secondaire pour assurer un bon ajustement. Sun a expliqué : « Puisque nous essayons d'avoir tous les composants sur les lunettes, nous avons dû concevoir personnalisément les zones pour chacun d'eux. »

L'autonomie de la batterie était une considération essentielle. Sun a déclaré : « Nous voulons que les étudiants l'utilisent pendant, plus ou moins, toute la journée scolaire. Nous étions vraiment préoccupés par l'autonomie de la batterie, surtout lorsque nous utilisons une si petite batterie. »

Entraînement du Logiciel

Nagori a entraîné personnalisément un réseau neuronal récurrent convolutif (CRNN) à l'aide d'un ensemble de données de 800 images. Les données d'entraînement provenaient de manuels scolaires et d'autres supports éducatifs, avec des images colorées et divers styles de police.

L'équipe a collecté les images elle-même sous trois conditions d'éclairage : éclairage de classe, faible éclairage et éclairage extérieur pour s'assurer que le modèle fonctionnait dans différents environnements.

Tests et Raffinement

Les étudiants ont mené des tests approfondis pour améliorer la précision. Sun a décrit le processus : « Après que tout notre matériel et notre logiciel ont été terminés, nous avons testé notre partie logiciel. Nous entrions des images que nous avions vues en ligne ou que nous avions prises nous-mêmes dans notre modèle logiciel. Ensuite, il extrayait le texte et nous donnait un fichier MP3, que nous pouvions utiliser pour améliorer notre précision. »

Succès au Concours et Défis

Le Thermo Fisher Scientific Junior Innovators Challenge représente l'un des plus grands concours de recherche STEM pour les étudiants. Le processus de sélection est très compétitif : les élèves du secondaire doivent d'abord concourir lors de foires scientifiques ou d'ingénierie locales, où les juges nomment les 10 % meilleurs projets. Environ 2 000 gagnants postulent pour le concours national, mais seulement 300 sont sélectionnés. Parmi ceux-ci, les juges choisissent 30 finalistes qui présentent leurs recherches à Washington, D.C.

L'équipe a fait face à d'importants obstacles pendant son parcours. Nagori a admis : « Nous avons passé de nombreuses nuits blanches. » Le défi le plus dramatique s'est produit quelques heures avant leur présentation lorsque les lunettes ont subi une panne critique.

Yen a décrit la crise : « Pendant le vol, une partie de notre soudure est tombée de la Raspberry Pi. Sans la soudure, rien ne fonctionnait, et les lunettes ne démarraient pas. Nous étions tous en mode panique. »

L'équipe s'est empressée de réparer l'appareil. Yen a poursuivi : « La veille de notre présentation, mon père est allé au magasin de mécanicien le plus proche et a acheté un fer à souder. Nous trois avons mis des masques, nous sommes penchés dessus et nous l'avons réparé. »

Bien qu'ils n'aient pas reçu de nomination initiale, les juges du niveau étatique ont assisté à leur concours et ont reconnu la valeur du projet. Sun a réfléchi à l'expérience : « Je pense que cela nous a vraiment appris que même si nous n'obtenons pas ce que nous voulons la première fois, tant que nous travaillons dur et restons engagés, nous pouvons revenir et être meilleurs. »

En plus du prix de 10 000 $ pour le projet de lunettes, Nagori a remporté le Thermo Fisher Scientific Leadership Award, et Sun a reçu 10 000 $ pour le Lemelson Foundation Award for Invention.

Projets Futurs et Développement

La recherche en est encore au stade du prototype, mais les étudiants ont des plans d'expansion ambitieux. Ils ont reçu une subvention de 5 000 $ pour développer leurs lunettes et toucher plus de membres de leur communauté.

Nagori a exposé leurs objectifs immédiats : « Nous travaillons actuellement à la mise en place de nombreuses nos lunettes dans toute la Californie. »

L'équipe se prépare déjà à une production à plus grande échelle. Nagori a noté qu'ils ont « une grande imprimante 3D dans mon garage en ce moment avec 30 Raspberry Pi, 30 caméras, 30 batteries. »

Le projet démontre comment une technologie innovante peut être développée à un coût abordable, contrastant avec les entreprises de la Silicon Valley qui lèvent des milliards pour développer des produits d'IA portables. Alors que les grandes entreprises technologiques investissent des ressources massives, ces adolescents