探索神经辐射场（NeRF）与可控神经特征场

### 探索神经辐射场（NeRF）与可控神经特征场 #### 1. 理解NeRF模型架构在之前的工作中，我们使用了NeRF模型类，但未深入了解其具体结构。接下来，我们将可视化神经网络的样子，并详细剖析代码，理解其实现方式。该神经网络以空间位置 $(x, y, z)$ 的谐波嵌入和 $(\theta, \phi)$ 的谐波嵌入作为输入，输出预测密度 $\sigma$ 和预测颜色 $(r, g, b)$。以下是我们要实现的网络架构： ![The simplified model architecture of the NeRF model](Figure 6.5) 需要注意的是，我们要实现的模型架构与原始NeRF模型架构不同，这里实现的是简化版本，该简化架构能使训练更快、更轻松。下面我们开始定义 `NeuralRadianceField` 类，并逐步分析该类定义的不同部分。完整的类定义可参考GitHub仓库中的代码。 1. **输入映射**：每个输入点是一个5维向量。直接在该输入上训练模型，在表示颜色和几何形状的高频变化时表现不佳，因为神经网络倾向于学习低频函数。解决此问题的有效方法是将输入空间映射到更高维空间进行训练，该映射函数是一组具有固定但独特频率的正弦函数。 2. **谐波嵌入**：将上述函数应用于输入向量的每个分量： ```python class NeuralRadianceField(torch.nn.Module): def __init__(self, n_harmonic_functions=60, n_hidden_neurons=256): super().__init__() self.harmonic_embedding = HarmonicEmbedding(n_harmonic_functions) ``` 3. **MLP主干网络**：神经网络由一个MLP主干组成，它以位置 $(x, y, z)$ 的嵌入作为输入，是一个全连接网络，使用的激活函数是 `softplus`（`softplus` 是 `ReLU` 激活函数的平滑版本），主干网络的输出是一个大小为 `n_hidden_neurons` 的向量： ```python embedding_dim = n_harmonic_functions * 2 * 3 self.mlp = torch.nn.Sequential( torch.nn.Linear(embedding_dim, n_hidden_neurons), torch.nn.Softplus(beta=10.0), torch.nn.Linear(n_hidden_neurons, n_hidden_neurons), torch.nn.Softplus(beta=10.0), ) ``` 4. **颜色层**：定义一个颜色层，它将MLP主干的输出嵌入与射线方向输入嵌入相结合，输出输入点的RGB颜色。因为颜色输出强烈依赖于点的位置和观察方向，所以将这些输入结合起来很重要： ```python self.color_layer = torch.nn.Sequential( torch.nn.Linear(n_hidden_neurons + embedding_dim, n_hidden_neurons), torch.nn.Softplus(beta=10.0), torch.nn.Linear(n_hidden_neurons, 3), torch.nn.Sigmoid(), ) ``` 5. **密度层**：定义密度层，点的密度仅与其位置有关： ```python self.density_layer = torch.nn.Sequential( torch.nn.Linear(n_hidden_neurons, 1), torch.nn.Softplus(beta=10.0), ) self.density_layer[0].bias.data[0] = -1.5 ``` 6. **预测原始密度**：定义一个函数，根据密度层的输出预测原始密度： ```python def _get_densities(self, features): raw_densities = self.density_layer(features) return 1 - (-raw_densities).exp() ``` 7. **获取颜色**：同样，为了根据射线方向获取某点的颜色，首先对射线方向输入应用位置编码函数，然后将其与MLP主干的输出连接起来： ```python def _get_colors(self, features, rays_directions): spatial_size = features.shape[:-1] rays_directions_normed = torch.nn.functional.normalize( rays_directions, dim=-1 ) rays_embedding = self.harmonic_embedding( rays_directions_normed ) rays_embedding_expand = rays_embedding[..., None, :].expand( *spatial_size, rays_embedding.shape[ ```

最低0.47元/天解锁专栏

赠100次下载

继续阅读点击查看下一篇

400次会员资源下载次数

300万+ 优质博客文章

1000万+ 优质下载资源

1000万+ 优质文库回答

复制全文

探索神经辐射场（NeRF）与可控神经特征场

相关推荐

专栏目录

探索神经辐射场（NeRF）与可控神经特征场

相关推荐

神经辐射场的用户可控几何编辑：新视图合成与实时变形

nerf神经辐射场

基于扩散模型的抗锯齿神经辐射场（Drantal-NeRF）方法

CLIP-NeRF：文本与图像驱动的神经辐射场编辑框架

可控神经辐射场：新视图与属性渲染的突破

稀疏多视角下可控人体模型的神经辐射场对准方法

可编辑场景的神经辐射场：对象组合与实时渲染

PixelNeRF技术：神经辐射场的图像合成

Control-NeRF：3D场景编辑与操作的可编辑特征映射

Block-NeRF：大规模场景神经视图合成的创新方法

JS正则表达式

Fourier Transform Library (MATLAB interface based on C++ imp

专栏目录

最新推荐

模型生产化：从本地部署到云端容器化

利用PyTorch进行快速原型开发

强化学习与合成数据生成：UnityML-Agents深度解析

二维和三维偏微分方程耦合求解及生命科学中常微分方程问题的解决

利用Kaen实现PyTorch分布式训练及超参数优化

电力电子中的Simulink应用：锁相环、静止无功补偿器与变流器建模

使用PyTorch构建电影推荐系统

排行榜接入全攻略：第三方SDK集成实战详解

多视图检测与多模态数据融合实验研究

模糊推理系统对象介绍