Speaker Diarization with Session-Level Speaker Embedding Refinement Using Graph Neural Networks

被引：0

作者：

Wang, Jixuan ^{[1
]}

Xiao, Xiong ^{[2
]}

Wu, Jian ^{[2
]}

Ramamurthy, Ranjani ^{[2
]}

Rudzicz, Frank ^{[1
]}

Brudno, Michael ^{[1
]}

机构：

[1] University of Toronto, Canada

[2] Microsoft, United States

来源：

ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings | 2020年 / 2020-May卷

关键词：

Compendex;

D O I：

9054176

中图分类号：

学科分类号：

摘要：

Graph neural networks - Speech recognition - Deep neural networks - Clustering algorithms - Matrix algebra

引用

页码：7109 / 7113

共 50 条

[1] SPEAKER DIARIZATION WITH SESSION-LEVEL SPEAKER EMBEDDING REFINEMENT USING GRAPH NEURAL NETWORKS
Wang, Jixuan
Xiao, Xiong
Wu, Jian
Ramamurthy, Ranjani
Rudzicz, Frank
Brudno, Michael
[J]. 2020 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, 2020, : 7109 - 7113
[2] Speaker diarization using autoassociative neural networks
Jothilakshmi, S.
Ramalingam, V.
Palanivel, S.
[J]. ENGINEERING APPLICATIONS OF ARTIFICIAL INTELLIGENCE, 2009, 22 (4-5) : 667 - 675
[3] Speaker Diarization using Embedding Vectors
Toruk, Mesut
Bilgin, Gokhan
Serbes, Ahmet
[J]. 2020 28TH SIGNAL PROCESSING AND COMMUNICATIONS APPLICATIONS CONFERENCE (SIU), 2020,
[4] Speaker Diarization Using Deep Recurrent Convolutional Neural Networks for Speaker Embeddings
Cyrta, Pawel
Trzcinski, Tomasz
Stokowiec, Wojciech
[J]. INFORMATION SYSTEMS ARCHITECTURE AND TECHNOLOGY, PT I, 2018, 655 : 107 - 117
[5] Speaker Diarization Using Convolutional Neural Network for Statistics Accumulation Refinement
Zajic, Zbynek
Hruz, Marek
Mueller, Ladek
[J]. 18TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2017), VOLS 1-6: SITUATED INTERACTION, 2017, : 3562 - 3566
[6] JOINT SPEAKER DIARIZATION AND RECOGNITION USING CONVOLUTIONAL AND RECURRENT NEURAL NETWORKS
Zhou, Zhihan
Zhang, Yichi
Duan, Zhiyao
[J]. 2018 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), 2018, : 2496 - 2500
[7] Online Neural Speaker Diarization With Target Speaker Tracking
Wang, Weiqing
Li, Ming
[J]. IEEE/ACM Transactions on Audio Speech and Language Processing, 2024, 32 : 5078 - 5091
[8] A Modified Approach to Cluster Refinement for Speaker Diarization
Zhu, Liping
[J]. PROCEEDINGS OF 2015 4TH INTERNATIONAL CONFERENCE ON COMPUTER SCIENCE AND NETWORK TECHNOLOGY (ICCSNT 2015), 2015, : 1457 - 1460
[9] Speaker Diarization Based on Locally Linear Embedding
Shahar, Ori
Twito, Lee
Spingarn, Nurit
Cohen, Israel
[J]. 2016 IEEE INTERNATIONAL CONFERENCE ON THE SCIENCE OF ELECTRICAL ENGINEERING (ICSEE), 2016,
[10] ANSD-MA-MSE: Adaptive Neural Speaker Diarization Using Memory-Aware Multi-Speaker Embedding
He, Mao-Kui
Du, Jun
Liu, Qing-Feng
Lee, Chin-Hui
[J]. IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2023, 31 : 1561 - 1573

← 1 2 3 4 5 →