Este trabajo presenta un modelo informático que basándose tanto en la interconexión de las neuronas en el cerebro, como en el trabajo de un comité de expertos, permite realizar el reconocimiento automático de patrones en grandes volúmenes de datos. La ventaja que aporta es el poder evitar la influencia que puede tener la escala en que estos se representen para dicho reconocimiento. La investigación se ha llevado a cabo entre la Universidad de Burgos y la Universidad de Salamanca.

Resumen:

La capacidad de los sistemas informáticos poder analizar grandes volúmenes de información (Big Data) es hoy en día cada vez más relevante. En este trabajo se presenta y analiza un método nuevo para este análisis. Este método llamado Weighted Voting Superposition – Scale Invariant Map (WeVoS-SIM), se basa en la combinación de varios métodos anteriores: el mapa SIM y el método de combinación WeVoS.

El primero es un algoritmo incluido dentro de la familia de las llamadas “Redes Neuronales Artificiales”. Estos algoritmos pretenden imitar el comportamiento del cerebro, por medio de unidades sencillas de computación que trabajan en paralelo para permitir el reconocimiento de patrones en grandes cantidades de datos. Para ello, primero se analiza y se adapta a un conjunto de datos conocidos, construyendo así un “mapa” de la organización de estos datos. En una segunda fase, cuando se le faciliten nuevos datos aún no estudiados, identificará que regiones del mapa construido anteriormente pueden ser las más similares a estos, permitiendo identificar las características más importantes de los mismos. Una de las novedades del sistema es permitir realizar estos mapas de forma independiente de la escala de representación de los datos, teniendo por tanto un factor menos a tener en cuenta para su análisis. Un ejemplo de este tipo de problemas son las imágenes digitales, en las que es muy útil poder reconocer objetos independientemente de su distancia a la cámara.

La segunda novedad del sistema es el método de combinación que permite a varias instancias de los algoritmos trabajar a la vez –de manera que pueden cubrir más “regiones” de los datos– pudiendo luego unificar los “mapas de datos” empleando las regiones más interesantes encontradas por cada uno.

Como prueba de concepto del sistema se ha probado a realizar el análisis de varios conjuntos de datos, tanto artificiales como casos de aplicación real, comparándolo con otros algoritmos de la misma familia ampliamente empleados para estas tareas. Los resultados obtenidos demuestran que el modelo presentado, aunque no es capaz de superar a estos algoritmos en todos los casos, si lo hace en aquellos en que la identificación de los datos depende de la independencia de la escala.

Palabras Clave: Minería de Datos, Redes Neuronales, Comité de Expertos, Escala Invariante.

Referencia bibliográfica del artículo:

Baruque, B., Corchado, E. (2014). WeVoS scale invariant map. Information Sciences, v. 280, p. 307-321. doi: 10.1016/j.ins.2014.05.005.

Dirección de contacto con el autor:

Bruno Baruque (bbaruque@ubu.es). Universidad de Burgos. Escuela Politécnica Superior, Dept. Ingeniería Civil, Área Lenguajes y Sistemas Informáticos. Grupo de Investigación Inteligencia Computacional Aplicada (GICAP).

Datos de la revista:

Information Sciences  (Elsevier). ISSN: 0020-0255, eISSN: 1872-6291

  • Revista indexada en  Science Citation Index (WOS)
  • Factor de impacto (2013): 3,893.  Q1 posición 8/153 en la categoría Computer Science, Information Systems (Fuente consultada Journal Ctitation Report®)
  • SCImago Journal Rank (SJR): 2,606. Q1 posición 20/1129 en la categoría Computer Science Applications.

Otra información relevante:

Corchado, E.; Mata, A.; Baruque, B.; Corchado, J. M.; Perez-Lancho, B. (2011). A topology-preserving system for environmental models forecasting. International Journal of Computer Mathematics, v. 88, p. 1979-1989. doi: 10.1080/00207160.2010.527002.

Baruque, B., Corchado, E. (2010). A weighted voting summarization of SOM ensembles. Data Mining and Knowledge Discovery, v. 21, p. 398-426. Doi: 10.1007/s10618-009-0160-3.

 Resumen redactado por Bruno Baruque.