x
3.4.3 Low-Rank Subspace Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.5 Notations and Preliminaries . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.6 Multimodal Transductive Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.6.1 Objective Formulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.6.2 Optimization . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.6.3 Experiments and Results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.7 Multi-Modal Transductive Low-Rank Learning . . . . . . . . . . . . . . . . . . . . . . . 39
3.7.1 Objective Formulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.7.2 Optimization . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.7.3 Experiments and Results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.8 Summary . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4
Multimodal Cooperative Learning for Micro-Video Venue Categorization . . 59
4.1 Background . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.2 Research Problems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.3 Related Work . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.3.1 Multimedia Venue Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.3.2 Multi-Modal Multi-Task Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.3.3 Dictionary Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.4 Multimodal Consistent Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.4.1 Optimization . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.4.2 Task Relatedness Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
4.4.3 Complexity Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4.4.4 Experiments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
4.5 Multimodal Complementary Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4.5.1 Multi-Modal Dictionary Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.5.2 Tree-Guided Multi-Modal Dictionary Learning . . . . . . . . . . . . . . . . 75
4.5.3 Optimization . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.5.4 Online Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
4.5.5 Experiments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.6 Multimodal Cooperative Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
4.6.1 Multimodal Early Fusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
4.6.2 Cooperative Networks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
4.6.3 Attention Networks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
4.6.4 Experiments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
4.7 Summary . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107