probabilistic machine learning for civil engineers vii
6.7.1 Maximum Likelihood and Posterior Estimates . . . . . . . . . . . . . . . 82
6.7.2 Laplace Approximation . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
6.8 Model Selection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
7 Markov Chain Monte Carlo 89
7.1 Metropolis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
7.2 Metropolis-Hastings . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
7.3 Convergence Checks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
7.3.1 Burn-In Phase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
7.3.2 Monitoring Convergence . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
7.3.3 Estimated Potential Scale Reduction . . . . . . . . . . . . . . . . . . . . 94
7.3.4 Acceptance Rate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
7.3.5 Proposal Tuning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
7.4 Space Transformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
7.5 Computing with MCMC Samples . . . . . . . . . . . . . . . . . . . . . . . . . . 99
III Supervised Learning 105
8 Regression 107
8.1 Linear Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
8.1.1 Mathematical Formulation . . . . . . . . . . . . . . . . . . . . . . . . . 108
8.1.2 Overfitting and Cross-Validation . . . . . . . . . . . . . . . . . . . . . . 110
8.1.3 Mathematical Formulation >1-D . . . . . . . . . . . . . . . . . . . . . . 113
8.1.4 Limitations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
8.2 Gaussian Process Regressi on . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
8.2.1 Updating a GP Using Exact Observations . . . . . . . . . . . . . . . . . 116
8.2.2 Updating a GP Using Imperfect Observations . . . . . . . . . . . . . . . 118
8.2.3 Multiple Covariates . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
8.2.4 Parameter Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
8.2.5 Example: Soil Contamination Characterization . . . . . . . . . . . . . . 121
8.2.6 Example: Metamodel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
8.2.7 Advanced Considerations . . . . . . . . . . . . . . . . . . . . . . . . . . 124
8.3 Neural Networks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
8.3.1 Feedforward Neural Networks . . . . . . . . . . . . . . . . . . . . . . . . 127
8.3.2 Parameter Estimation and Backpropagation . . . . . . . . . . . . . . . . 132
8.3.3 Regularization . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
8.3.4 Example: Metamodel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
9 Classification 139
9.1 Generative Classifiers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
9.1.1 Formulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
9.1.2 Example: Post-Earthquake Structural Safety Assessment . . . . . . . . . 143
9.2 Logistic Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144