论文学习

三维点云大场景下的问题

Farthest Point Sampling (FPS):
每次选取最远的点作为下一个采样点。
优势：覆盖性好，有很好的采样效果。
劣势：时间复杂度 $\Theta (n^2)$ ，可扩展性差。
Inverse Density Importance Sampling (IDIS):
计算点的密度，在高密度区域多采样，低密度区域少采样，且尽量保留低密度的点。
优势：密度控制，较好地保留特征。
劣势：时间复杂度 $\Theta (n)$ ，对噪声数据敏感。
Random Sampling (RS):
随机取样。
优势：时间复杂度 $\Theta (1)$ ，没有多余的内存占用。
劣势：可能会丢失有用的特征。

Generator-based Sampling (GS):
生成一个子集以近似替代原始点云。
优势：任务特异性，数据驱动的采样。
劣势：需要使用 FPS 进行拟合，增大计算量。
Continuous Relaxation based Sampling (CRS):
通过参数化方法为数据降低数量。
优势：差异化的端到端训练。
劣势：空间复杂度高，占用空间过大。
Policy Gradient based Sampling (PGS):
通过马尔可夫决策过程进行采样，学习采样的概率分布得到一个采样规则。
优势：学习一个高效的采样规则。
劣势：巨大的可行域，有可能落入局部最优解。

随机取样是比较合适的方法，问题在于如何保留特征。

使用 KNN 算法找到数据集合中的邻居，对邻居的信息编码，提取为一些特征并和原始的点的特征合并后，由学习算法赋予不同的特征以权重，进而进行数据池化。

为保证更多的信息和邻居数据不会被随机抽样的过程丢失，选择使用多次的局部特征提取和池化，更好的聚合数据特征并使得单个点所关联的点的范围更大，有利于更好的分类。