{rfName}
An

Licencia y uso

Icono OpenAccess

Citaciones

3

Altmetrics

Análisis de autorías institucional

Torre-Toledano, DoroteoAutor o Coautor

Compartir

Publicaciones
>
Artículo

An Overview of the IberSpeech-RTVE 2022 Challenges on Speech Technologies

Publicado en:Applied Sciences-Basel. 13 (15): 8577- - 2023-08-01 13(15), DOI: 10.3390/app13158577

Autores: Lleida, E; Rodriguez-Fuentes, LJ; Tejedor, J; Ortega, A; Miguel, A; Bazan, V; Perez, C; de Prada, A; Penagarikano, M; Varona, A; Bordel, G; Torre-Toledano, D; Alvarez, A; Arzelus, H

Afiliaciones

Basque Res & Technol Alliance BRTA, Fdn Vicomtech, Mikeletegi 57, San Sebastian 20009, Spain - Autor o Coautor
Corp Radiotelevis Espanola, Madrid 28223, Spain - Autor o Coautor
Univ Autonoma Madrid, Escuela Politecn Super, Elect & Commun Technol Dept, AUDIAS, Ave Francisco Tomas & Valiente 11, Madrid 28049, Spain - Autor o Coautor
Univ Basque Country UPV EHU, Fac Sci & Technol, Dept Elect & Elect, Leioa 48940, Spain - Autor o Coautor
Univ San Pablo CEU, CEU Univ, Inst Technol, Urbanizac Monteprincipe, Boadilla Del Monte 28668, Spain - Autor o Coautor
Univ Zaragoza, Aragon Inst Engn Res I3A, Vivolab, Zaragoza 50018, Spain - Autor o Coautor
Ver más

Resumen

Evaluation campaigns provide a common framework with which the progress of speech technologies can be effectively measured. The aim of this paper is to present a detailed overview of the IberSpeech-RTVE 2022 Challenges, which were organized as part of the IberSpeech 2022 conference under the ongoing series of Albayzin evaluation campaigns. In the 2022 edition, four challenges were launched: (1) speech-to-text transcription; (2) speaker diarization and identity assignment; (3) text and speech alignment; and (4) search on speech. Different databases that cover different domains (e.g., broadcast news, conference talks, parliament sessions) were released for those challenges. The submitted systems also cover a wide range of speech processing methods, which include hidden Markov model-based approaches, end-to-end neural network-based methods, hybrid approaches, etc. This paper describes the databases, the tasks and the performance metrics used in the four challenges. It also provides the most relevant features of the submitted systems and briefly presents and discusses the obtained results. Despite employing state-of-the-art technology, the relatively poor performance attained in some of the challenges reveals that there is still room for improvement. This encourages us to carry on with the Albayzin evaluation campaigns in the coming years.

Palabras clave

Albayzin evaluationsIberspeech challengeRtve2022 databaseSearch on speechSpeaker diarization and identity assignmentSpeech-to-text transcriptionText and speech alignment

Indicios de calidad

Impacto bibliométrico. Análisis de la aportación y canal de difusión

El trabajo ha sido publicado en la revista Applied Sciences-Basel debido a la progresión y el buen impacto que ha alcanzado en los últimos años, según la agencia WoS (JCR), se ha convertido en una referencia en su campo. En el año de publicación del trabajo, 2023, se encontraba en la posición 44/181, consiguiendo con ello situarse como revista Q1 (Primer Cuartil), en la categoría Engineering, Multidisciplinary.

2025-07-01:

  • Google Scholar: 3

Impacto y visibilidad social

Desde la dimensión de Influencia o adopción social, y tomando como base las métricas asociadas a las menciones e interacciones proporcionadas por agencias especializadas en el cálculo de las denominadas “Métricas Alternativas o Sociales”, podemos destacar a fecha 2025-07-01:

  • La utilización de esta aportación en marcadores, bifurcaciones de código, añadidos a listas de favoritos para una lectura recurrente, así como visualizaciones generales, indica que alguien está usando la publicación como base de su trabajo actual. Esto puede ser un indicador destacado de futuras citas más formales y académicas. Tal afirmación es avalada por el resultado del indicador “Capture” que arroja un total de: 4 (PlumX).

Con una intencionalidad más de divulgación y orientada a audiencias más generales podemos observar otras puntuaciones más globales como:

    Es fundamental presentar evidencias que respalden la plena alineación con los principios y directrices institucionales en torno a la Ciencia Abierta y la Conservación y Difusión del Patrimonio Intelectual. Un claro ejemplo de ello es:

    • El trabajo se ha enviado a una revista cuya política editorial permite la publicación en abierto Open Access.
    • Asignación de un Handle/URN como identificador dentro del Depósito en el Repositorio Institucional: https://repositorio.uam.es/handle/10486/715006