Hace poco nos dieron una noticia muy buena de parte de nuestras familias a mi compañero de proyecto de grado y a mí: que debíamos graduarnos ya o no graduarnos, ya que por un lado él se tenía que ir a vivir a otra parte y ya no podría terminar sus estudios en la U, y yo ya estaría trabajando por fuera de la U. Esto fue el impulsor de que en apenas dos meses nos rindiera el trabajo a costa de sacrificar horas de sueño y cualquier trabajo externo que pudiéramos estar haciendo. El resultado no pudo haber sido mejor: un proyecto que sorprendió a todos, con una documentación completamente realizada en LaTeX y cumpliendo con las normas ICONTEC, y una pequeña posibilidad de que nuestro proyecto salga laureado.
Es por esta razón que no había vuelto a escribir en el blog. Simplemente no había quedado tiempo ni para visitar a mi familia, pero ha valido la pena el sacrificio ya que tengo algo importante para contar. Nuestro proyecto de grado consistía en diseñar y probar una aplicación prototipo que pudiera reconocer la voz en español, de modo que se le pudieran dictar expresiones matemáticas al computador y éste las escribiera por uno. ¿Suena sencillo? Realmente lo sería si tuviéramos herramientas comerciales (y el músculo económico) para hacerlo, pero queríamos trabajar con software libre y estándares abiertos.
El primer tropiezo fue con el reconocimiento de voz, que no sólo no existía una aplicación libre que lo hiciera en español, sino que no había suficiente documentación al respecto. Así que investigamos y encontramos dos importantísimas vetas: el motor de reconocimiento de voz de propósito general CMU Sphinx-4 y el repositorio de corpus acústicos de VoxForge. Gracias a estos dos proyectos pudimos solventar el primer gran problema del prototipo.
El segundo tropiezo fue con el reconocimiento de expresiones matemáticas. Inicialmente habíamos pensado que sería fácil crear una gramática para las matemáticas (y puede serlo), pero se nos había olvidado que debía hacerse para las matemáticas habladas, de modo que gran parte del segundo embrollo requirió una delimitación precisa y minuciosa de las expresiones que queríamos que reconociera el prototipo.
El tercer tropiezo surgió con el documento del proyecto de grado. Las normas ICONTEC son suficientemente enredadas y singulares como para no ajustarse a ninguna plantilla existente en LaTeX, Lo más cercano es la plantilla para libros, por lo que mi compañero se dedicó a desarrollar una plantilla mientras yo trabajaba en la U y conseguía las especificaciones de las normas. Finalmente se llegó el tiempo de revisiones del documento con nuestro profesor guía, y fue entonces cuando comenzó el Gran Caos. La verdad no teníamos prácticamente nada del documento escrito cuando empezaron las vacaciones del semestre pasado. Pero gracias a LaTeX y a Dropbox pudimos completarlo en el tiempo que nos dieron. Otros servicios similares nos podrían haber servido, pero no tuvimos tiempo de probar ningún otro.
Finalmente llegó el día de la sustentación y pudimos entregar nuestro trabajo a la Universidad. Subimos todo el contenido a SourceForge, y la página del proyecto, para que lo conozcan y lo descarguen, es http://algevox.sf.net
No hay comentarios.:
Publicar un comentario