{rfName}

Licencia y uso

Altmetrics

Grant support

This workwas supported in part by the National Natural Science Foundation of China under Grant 62171353 and Grant 62101409 and in part by the Fundamental Research Funds for the Central Universities under Grant JB190116. The work of Luis Herranz was supported by the Grant PID2021-128178OB-I00(Ministry of Science, Innovation and Universities (MICINN), Spain) and inpart by the Ramon y Cajal under Grant RYC2019-027020-I.

Análisis de autorías institucional

Herranz, LuisAutor o Coautor
Compartir
Publicaciones
>
Artículo

Task-Switchable Pre-Processor for Image Compression for Multiple Machine Vision Tasks

Publicado en:IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY. 34 (7): 6416-6429 - 2024-07-01 34(7), DOI: 10.1109/TCSVT.2023.3348995

Autores: Yang, Mingyi; Yang, Fei; Murn, Luka; Blanch, Marc Gorriz; Sock, Juil; Wan, Shuai; Yang, Fuzheng; Herranz, Luis

Afiliaciones

BBC Res & Dev, London EC4Y 0DS, England - Autor o Coautor
Nankai Univ, Coll Comp Sci, Tianjin 300350, Peoples R China - Autor o Coautor
Northwestern Polytech Univ, Sch Elect & Informat, Xian 710072, Peoples R China - Autor o Coautor
RMIT Univ, Sch Engn, Melbourne, Vic 3001, Australia - Autor o Coautor
Univ Autonoma Barcelona, Comp Vis Ctr, Barcelona 08193, Spain - Autor o Coautor
Xidian Univ, Sch Telecommun Engn, Xian, Peoples R China - Autor o Coautor
Ver más

Resumen

Visual content is increasingly being processed by machines for various automated content analysis tasks instead of being consumed by humans. Despite the existence of several compression methods tailored for machine tasks, few consider real-world scenarios with multiple tasks. In this paper, we aim to address this gap by proposing a task-switchable pre-processor that optimizes input images specifically for machine consumption prior to encoding by an off-the-shelf codec designed for human consumption. The proposed task-switchable pre-processor adeptly maintains relevant semantic information based on the specific characteristics of different downstream tasks, while effectively suppressing irrelevant information to reduce bitrate. To enhance the processing of semantic information for diverse tasks, we leverage pre-extracted semantic features to modulate the pixel-to-pixel mapping within the pre-processor. By switching between different modulations, multiple tasks can be seamlessly incorporated into the system. Extensive experiments demonstrate the practicality and simplicity of our approach. It significantly reduces the number of parameters required for handling multiple tasks while still delivering impressive performance. Our method showcases the potential to achieve efficient and effective compression for machine vision tasks, supporting the evolving demands of real-world applications.

Palabras clave
Bit rateCodecsFeature extractionImage codingImage compression for machine visionMachine visionMultiple taskPre-processorSemanticsTask analysis

Indicios de calidad

Impacto bibliométrico. Análisis de la aportación y canal de difusión

El trabajo ha sido publicado en la revista IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY debido a la progresión y el buen impacto que ha alcanzado en los últimos años, según la agencia WoS (JCR), se ha convertido en una referencia en su campo. En el año de publicación del trabajo, 2024 aún no existen indicios calculados, pero en 2023, se encontraba en la posición 20/353, consiguiendo con ello situarse como revista Q1 (Primer Cuartil), en la categoría Engineering, Electrical & Electronic. Destacable, igualmente, el hecho de que la Revista está posicionada por encima del Percentil 90.

2025-05-25:

  • Google Scholar: 1
  • Scopus: 4
Impacto y visibilidad social

Desde la dimensión de Influencia o adopción social, y tomando como base las métricas asociadas a las menciones e interacciones proporcionadas por agencias especializadas en el cálculo de las denominadas “Métricas Alternativas o Sociales”, podemos destacar a fecha 2025-05-25:

  • La utilización de esta aportación en marcadores, bifurcaciones de código, añadidos a listas de favoritos para una lectura recurrente, así como visualizaciones generales, indica que alguien está usando la publicación como base de su trabajo actual. Esto puede ser un indicador destacado de futuras citas más formales y académicas. Tal afirmación es avalada por el resultado del indicador “Capture” que arroja un total de: 4 (PlumX).

Con una intencionalidad más de divulgación y orientada a audiencias más generales podemos observar otras puntuaciones más globales como:

    Análisis de liderazgo de los autores institucionales

    Este trabajo se ha realizado con colaboración internacional, concretamente con investigadores de: Australia; China; United Kingdom.

    Existe un liderazgo significativo ya que algunos de los autores pertenecientes a la institución aparecen como primer o último firmante, se puede apreciar en el detalle: Último Autor (HERRANZ ARRIBAS, LUIS).