📋

Hechos Clave

  • Tres estudiantes de 15 años de Santa Clara, California, crearon gafas inteligentes con IA por menos de $100
  • El prototipo convierte texto a voz en tiempo real con más del 90% de precisión y un tiempo de carga promedio de 13 segundos
  • El dispositivo utiliza una placa de computadora Raspberry Pi, cámara, batería y altavoces para capturar y procesar texto
  • El equipo ganó un premio de $10,000 en el Thermo Fisher Scientific Junior Innovators Challenge
  • Las gafas fueron entrenadas usando 800 imágenes de libros de texto escolares recolectadas bajo tres condiciones de iluminación

Resumen Rápido

Tres adolescentes californianos desarrollaron gafas inteligentes con IA que convierten texto a voz para estudiantes con discapacidad visual. El dispositivo cuesta menos de $100 para construir.

Akhil Nagori, Evann Sun y Lucas Shengwen Yen pasaron cinco meses creando el prototipo. Las gafas utilizan una placa de computadora Raspberry Pi, cámara, batería y altavoces para capturar imágenes, extraer texto y reproducir audio a través de altavoces integrados.

Los estudiantes inscribieron su proyecto en el Thermo Fisher Scientific Junior Innovators Challenge y ganaron un premio de $10,000. La competencia selecciona solo 300 finalistas nacionales de aproximadamente 2,000 solicitantes.

Las gafas logran más del 90% de precisión con un tiempo de carga promedio de 13 segundos. El equipo entrenó su software usando 800 imágenes de libros de texto escolares recolectadas bajo tres condiciones de iluminación.

Nagori también recibió el Thermo Fisher Scientific Leadership Award, mientras que Sun ganó el Lemelson Foundation Award for Invention. Los estudiantes recibieron una subvención de $5,000 para escalar la producción y planean distribuir las gafas en todo California.

La Innovación Detrás de las Gafas

Tres estudiantes de 15 años de Santa Clara crearon gafas inteligentes de texto a voz impulsadas por inteligencia artificial. La tecnología portátil ayuda a estudiantes con discapacidad visual a acceder a materiales de lectura de cualquier formato.

El prototipo requirió cinco meses de desarrollo y costó menos de $100 para construir. Akhil Nagori explicó la motivación detrás del proyecto: "Nuestro objetivo principal era crear una forma fácil y rentable de transcribir texto de cualquier formato para estudiantes con discapacidad visual".

Las gafas funcionan tomando fotos de texto, extrayendo el contenido y convirtiéndolo a audio que se reproduce a través de pequeños altavoces integrados en los marcos. El dispositivo utiliza una placa de computadora Raspberry Pi, cámara, batería y altavoces. También incluye un pequeño interruptor de encendido y apagado.

Las métricas de rendimiento muestran que el prototipo logra más del 90% de precisión al traducir texto a voz. Lucas Shengwen Yen destacó la importancia de la velocidad: "Uno de los aspectos más importantes de nuestro proyecto es el tiempo de carga. Y eso promedió alrededor de 13 segundos".

La inspiración vino de una experiencia personal. Nagori viajó a India para visitar a su familia, incluido su tío abuelo que tiene discapacidad visual y trabaja como cajero. Él observó: "Él tiene todas estas cajas llenas de recibos en braille. Tiene que revisarlos línea por línea. Cuando vi eso, dije: 'Tiene que haber una forma más fácil que no sea tan tediosa'".

Proceso de Desarrollo Técnico

Los estudiantes enfrentaron tres desafíos principales durante el desarrollo: diseño de hardware, programación de software y recolección de datos a través de pruebas.

Diseño de Hardware

Evann Sun lideró el diseño de hardware utilizando el software CAD Fusion 360 y una impresora 3D para crear marcos personalizados. El equipo investigó las dimensiones promedio de gafas para estudiantes de secundaria para asegurar un ajuste adecuado. Sun explicó: "Como estamos tratando de tener todos los componentes en las gafas, tuvimos que diseñar personalmente las áreas para todos ellos".

La duración de la batería fue una consideración crítica. Sun declaró: "Queremos que los estudiantes usen esto durante, más o menos, todo el día escolar. Estamos muy preocupados por la duración de la batería, especialmente cuando usamos una batería tan pequeña".

Capacitación de Software

Nagori entrenó personalmente una red neuronal recurrente convolucional (CRNN) usando un conjunto de datos de 800 imágenes. Los datos de entrenamiento provinieron de libros de texto escolares y otros materiales educativos, con imágenes coloridas y varios estilos de fuente.

El equipo recolectó imágenes por sí mismo bajo tres condiciones de iluminación: iluminación de aula, iluminación baja e iluminación al aire libre para asegurar que el modelo funcionara en diferentes entornos.

Pruebas y Refinamiento

Los estudiantes realizaron pruebas extensas para mejorar la precisión. Sun describió el proceso: "Después de que todo nuestro hardware y software estuvieron listos, probamos nuestra parte de software. Introducíamos imágenes que veíamos en línea o que tomamos nosotros mismos en nuestro modelo de software. Luego, extraía el texto y nos daba un archivo MP3, que podíamos usar para mejorar nuestra precisión".

Éxito en la Competencia y Desafíos

El Thermo Fisher Scientific Junior Innovators Challenge representa una de las principales competencias de investigación STEM para estudiantes. El proceso de selección es altamente competitivo: los estudiantes de secundaria primero deben competir en ferias de ciencias o ingeniería locales, donde los jueces nominan el 10% superior de los proyectos. Aproximadamente 2,000 ganadores aplican para la competencia nacional, pero solo 300 son seleccionados. De esos, los jueces eligen 30 finalistas que presentan su investigación en Washington, D.C.

El equipo enfrentó obstáculos significativos durante su viaje. Nagori admitió: "Tuvimos muchas noches sin dormir". El desafío más dramático ocurrió horas antes de su presentación cuando las gafas sufrieron una falla crítica.

Yen describió la crisis: "En el vuelo hacia allá, parte de nuestra soldadura se soltó de la Raspberry Pi. Sin la soldadura, nada funcionaba, y las gafas no se iniciaban. Todos estábamos en modo de pánico".

El equipo se apresuró a arreglar el dispositivo. Yen continuó: "La noche antes de que presentáramos, mi papá corrió a la tienda de mecánica más cercana y consiguió un soldador. Los tres nos pusimos máscaras, nos inclinamos y lo arreglamos".

A pesar de no recibir una nominación inicial, los jueces a nivel estatal asistieron a su competencia y reconocieron el valor del proyecto. Sun reflexionó sobre la experiencia: "Creo que realmente nos enseñó que incluso si no obtenemos lo que queremos la primera vez, mientras trabajemos duro y nos mantengamos comprometidos, podemos volver y ser mejores".

Además del premio de $10,000 por el proyecto de las gafas, Nagori ganó el Thermo Fisher Scientific Leadership Award, y Sun recibió $10,000 por el Lemelson Foundation Award for Invention.

Planes Futuros y Escalado

La investigación sigue en fase de prototipo, pero los estudiantes tienen ambiciosos planes de expansión. Recibieron una subvención de $5,000 para escalar sus gafas y llegar a más de su comunidad.

Nagori delineó sus objetivos inmediatos: "Actualmente estamos trabajando en implementar muchas de nuestras gafas en todo California".

El equipo ya se está preparando para una producción a mayor escala. Nagori señaló que tienen "una impresora 3D grande en mi garaje ahora mismo con 30 Raspberry Pis, 30 cámaras, 30 baterías".

El proyecto demuestra cómo se puede desarrollar tecnología innovadora de manera asequible, en contraste con las empresas de Silicon Valley que están recaudando miles de millones para desarrollar productos de IA portátiles. Mientras las grandes empresas tecnológicas invierten recursos masivos, estos adolescentes demostraron que la innovación accesible es posible.