A Generalized Language Model in Tensor Space

被引：0

作者：

Zhang, Lipeng ^{[1
]}

Zhang, Peng ^{[1
]}

Ma, Xindian ^{[1
]}

Gu, Shuqin ^{[1
]}

Su, Zhan ^{[1
]}

Song, Dawei ^{[2
]}

机构：

[1] Tianjin Univ, Coll Intelligence & Comp, Tianjin, Peoples R China

[2] Beijing Inst Technol, Sch Comp Sci & Technol, Beijing, Peoples R China

来源：

THIRTY-THIRD AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE / THIRTY-FIRST INNOVATIVE APPLICATIONS OF ARTIFICIAL INTELLIGENCE CONFERENCE / NINTH AAAI SYMPOSIUM ON EDUCATIONAL ADVANCES IN ARTIFICIAL INTELLIGENCE | 2019年

关键词：

D O I：

暂无

中图分类号：

TP18 [人工智能理论];

学科分类号：

081104 ; 0812 ; 0835 ; 1405 ;

摘要：

In the literature, tensors have been effectively used for capturing the context information in language models. However, the existing methods usually adopt relatively-low order tensors, which have limited expressive power in modeling language. Developing a higher-order tensor representation is challenging, in terms of deriving an effective solution and showing its generality. In this paper, we propose a language model named Tensor Space Language Model (TSLM), by utilizing tensor networks and tensor decomposition. In TSLM, we build a high-dimensional semantic space constructed by the tensor product of word vectors. Theoretically, we prove that such tensor representation is a generalization of the n-gram language model. We further show that this high-order tensor representation can be decomposed to a recursive calculation of conditional probability for language modeling. The experimental results on Penn Tree Bank (PTB) dataset and WikiText benchmark demonstrate the effectiveness of TSLM.

引用

页码：7450 / 7458

页数：9

共 50 条

[1] Latent Space Model for Higher-Order Networks and Generalized Tensor Decomposition
Lyu, Zhongyuan
Xia, Dong
Zhang, Yuan
[J]. JOURNAL OF COMPUTATIONAL AND GRAPHICAL STATISTICS, 2023, 32 (04) : 1320 - 1336
[2] GENERALIZED WEYL CONFORMAL CURVATURE TENSOR OF GENERALIZED RIEMANNIAN SPACE
Vesic, Nenad O.
[J]. MISKOLC MATHEMATICAL NOTES, 2019, 20 (01) : 555 - 563
[3] On Douglas Tensor of Generalized Matsumoto Finsler Space
Gupta, M. K.
Sahu, Abha
[J]. LOBACHEVSKII JOURNAL OF MATHEMATICS, 2024, 45 (02) : 685 - 692
[4] Tensor Stein-rules in a generalized tensor regression model
Ghannam, Mai
Nkurunziza, Severien
[J]. JOURNAL OF MULTIVARIATE ANALYSIS, 2023, 198
[5] Projective curvature tensor on generalized (k, μ)-space forms
Shanmukha, B.
Venkatesha
[J]. ITALIAN JOURNAL OF PURE AND APPLIED MATHEMATICS, 2019, (42): : 840 - 850
[6] Tensor Space Model for Hypertext representation
Saha, Suman
Murthy, C. A.
Pal, Sankar K.
[J]. ICIT 2008: PROCEEDINGS OF THE 11TH INTERNATIONAL CONFERENCE ON INFORMATION TECHNOLOGY, 2008, : 261 - 266
[7] ON THE Q CURVATURE TENSOR OF A GENERALIZED SASAKIAN-SPACE-FORM
De, U. C.
Majhi, P.
[J]. KRAGUJEVAC JOURNAL OF MATHEMATICS, 2019, 43 (03): : 333 - 349
[8] ON THE PROJECTIVE CURVATURE TENSOR OF GENERALIZED SASAKIAN-SPACE-FORMS
De, U. C.
Sarkar, Avijit
[J]. QUAESTIONES MATHEMATICAE, 2010, 33 (02) : 245 - 252
[9] GENERALIZED SASAKIAN-SPACE-FORMS WITH PROJECTIVE CURVATURE TENSOR
Sarkar, A.
Akbar, Ali
[J]. DEMONSTRATIO MATHEMATICA, 2014, 47 (03) : 725 - 737
[10] A Generalized Model of Activity Space
Spielman, Seth E.
Singleton, Alex D.
[J]. ANNALS OF THE AMERICAN ASSOCIATION OF GEOGRAPHERS, 2022, 112 (08) : 2212 - 2229

← 1 2 3 4 5 →