Menú
Imagen AleatoriaWebcam: Pirámides (Giza)![]() AmigosBrero'sJ. C. Marcos Comentarios Recientes
|
Ayer viernes, mi cuerpo tuvo la estupenda idea de querer empezar a ponerse malo con una especie de catarro o algo, lo cual en ya casi vísperas de Feria en Sevilla es una basura. Así que decidí no salir para resguardarme algo. Ello provocó uno de estos momentos en los que uno se pone en plan Da Vinci, rellenando folios uno detrás de otros con soluciones e ideas relacionadas con un proyecto que uno tiene en mente y le ha estado dando vueltas durante un momento anterior del día. El proyecto en cuestión es, como no debe ya a estas alturas ser, mi proyecto de fin de carrera, y los problemas que me atormentan y para los que no encuentro una solución clara son los siguientes: como debe hacerse la nueva partición de una fórmula en símbolos, y cual es el método más adecuado para reconocer patrones sobre secuencias de símbolos. En la actualidad, lo primero es un problema porque los métodos de segmentado de imágenes que se utilizan no son lo suficientemente «despiadados». Para cortar, se calcula la cantidad de puntos por filas o por columnas que hay en una imagen. Los grupos de columnas de píxeles de la imagen (para el caso que queramos dividir la imagen por columnas, es todo aplicable también a filas si queremos dividir la imagen por filas) adyacentes para los que esta suma es 0, se denominan huecos, y las zonas que si tienen píxeles negros (en principio continuas, pero ya veremos que no) se intentan asignar a uno de los símbolos que deben haberse introducido en una base de datos de caracteres. Si no se puede, se pasa a intentar dividir esa zona por filas (si la zona se obtuvo dividiendo por columnas, y viceversa). Esto presupone algo que es falso, ya que consideramos que si no hay huecos perfectamente verticales u horizontales, la imagen no es divisible. Necesitamos un método más agresivo, como se ha dicho, para poder separar por ejemplo el símbolo de una raíz cuadrada de la expresión a la que se aplica. Por otra parte, es necesario asumir también un modelo más complejo para poder reconocer y tratar las estructuras semánticas de la fórmula. La aproximación actual usa la estructura recursiva dada por el proceso de segmentación dado anteriormente. Sin embargo, esto no es un método realmente adecuado ya que supone añadir ciertos trucos en la lógica de segmentado (como se hace para poder tratar los quebrados, por ejemplo), y no resulta verdaderamente extensible. La idea que ronda mi cabeza a este respecto es rechazar completamente la estructura arbórea generada al extraer los símbolos de una imagen (pero no estoy seguro de si no es mejor simplemente eliminar los hacks) y entonces hacer como se hace en el procesamiento de lenguajes formales. Una vez aplanado el árbol, buscar tokens, lo cual no debería ser difícil ya que los tokens serían elementos formados secuencialmente: números, etiquetas de funciones, operadores. Una vez encontrados los tokens, habría que procesarlos con una gramática. El problema de esta gramática, es que no estamos hablando de una estructura lineal de datos, en los que, como en el procesado de lenguajes, todo depende, a lo sumo, de uno o varios de los símbolos siguientes. En mi caso, el problema es que el concepto de símbolo siguiente no esta del todo claro, sino que más bien existe el concepto de símbolo adyacente, ya que las estructuras «siguientes» pueden estar no sólo a la derecha, sino también arriba, abajo, o en posiciones de súper y sub-índice. Mi intención para resolver esto, es intentar ser capaz de definir un «lenguaje visual de gramáticas recursivas para las fórmulas» (mucho ojo que como funcione esto va para la oficina de patentes ¿eh?) que permita establecer en una ventana de configuración los distintos patrones de tokens, y distintas estructuras recursivas. Un marrón curioso, vamos. PD: Los susodichos folios llenos de ideas estarán disponibles para nuestros amables consumidores para su subasta pública en unos 400 años en Shoteby's.
luis | Informática, Porque yo lo valgo | Sábado 05 Abril 2008 10:16am
Re: Al borde del catarro encontrarás la iluminación
Rafael Vargas, <> / Sábado 05 Abril 2008 2:12pm
Roman, te la estás jugando al escribir post de esta cañala. La gente quiere cosas cortas y fáciles de entender: bromas sobre Cthulu y cosas así P.D: Supongo que una vez acabes tu PFC podrías utilizarlo para auto-spamearte el blog, ¿no?
[ Responder (0) ]
Dejar un comentario |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||