{rfName}
Is

Licencia y uso

Altmetrics

Análisis de autorías institucional

Granados Sanandres, AnaAutor o CoautorCamacho Fernandez, DavidAutor o CoautorRodriguez Ortiz, Francisco BorjaAutor o Coautor

Compartir

19 de octubre de 2020
Publicaciones
>
Artículo
No

Is the contextual information relevant in text clustering by compression?

Publicado en:EXPERT SYSTEMS WITH APPLICATIONS. 39 (10): 8537-8546 - 2012-08-01 39(10), DOI: 10.1016/j.eswa.2012.01.215

Autores: Granados A; Camacho D; Rodríguez F

Afiliaciones

Universidad Autónoma de Madrid - Autor o Coautor

Resumen

Usually, when analyzing data that have not been processed or filtered yet, it can be observed that not all the data have equal importance. Thus, it is common to find relevant data surrounded by non relevant one. This occurs when analyzing textual information due to its intrinsic nature: texts contain words that provide a lot of information about the subject matter, whereas they contain other words with a little meaning or relevance. We believe that although in principle the non-relevant words are not as important as the relevant ones, the former constitute the substrate that supports the last. Since this substrate is the context that surrounds the relevant information, we call it the contextual information. In this paper, we analyze the relevance that the contextual information has in textual data, in a clustering by compression scenario. We generate the contextual information applying a distortion technique previously developed by the authors. One of the main characteristics of this technique is that it maintains the contextual information. In this paper we compare this technique with three new distortion techniques that destroy the contextual information in different ways. The experimental results support our hypothesis that the contextual information is relevant at least in the area of text clustering by compression. © 2012 Elsevier Ltd. All rights reserved.

Palabras clave

Compression-based text clusteringContextual informationWord removal

Indicios de calidad

Impacto bibliométrico. Análisis de la aportación y canal de difusión

El trabajo ha sido publicado en la revista EXPERT SYSTEMS WITH APPLICATIONS debido a la progresión y el buen impacto que ha alcanzado en los últimos años, según la agencia WoS (JCR), se ha convertido en una referencia en su campo. En el año de publicación del trabajo, 2012, se encontraba en la posición 13/79, consiguiendo con ello situarse como revista Q1 (Primer Cuartil), en la categoría Operations Research & Management Science.

Desde una perspectiva relativa, y atendiendo al indicador del impacto normalizado calculado a partir del Field Citation Ratio (FCR) de la fuente Dimensions, arroja un valor de: 1.45, lo que indica que, de manera comparada con trabajos en la misma disciplina y en el mismo año de publicación, lo ubica como trabajo citado por encima de la media. (fuente consultada: Dimensions Jul 2025)

De manera concreta y atendiendo a las diferentes agencias de indexación, el trabajo ha acumulado, hasta la fecha 2025-07-25, el siguiente número de citas:

  • WoS: 7
  • Scopus: 8
  • Google Scholar: 13

Impacto y visibilidad social

Desde la dimensión de Influencia o adopción social, y tomando como base las métricas asociadas a las menciones e interacciones proporcionadas por agencias especializadas en el cálculo de las denominadas “Métricas Alternativas o Sociales”, podemos destacar a fecha 2025-07-25:

  • La utilización de esta aportación en marcadores, bifurcaciones de código, añadidos a listas de favoritos para una lectura recurrente, así como visualizaciones generales, indica que alguien está usando la publicación como base de su trabajo actual. Esto puede ser un indicador destacado de futuras citas más formales y académicas. Tal afirmación es avalada por el resultado del indicador “Capture” que arroja un total de: 20 (PlumX).

Análisis de liderazgo de los autores institucionales

Existe un liderazgo significativo ya que algunos de los autores pertenecientes a la institución aparecen como primer o último firmante, se puede apreciar en el detalle: Primer Autor (GRANADOS SANANDRES, ANA) y Último Autor (RODRIGUEZ ORTIZ, FRANCISCO BORJA).