这不仅仅是你从互联网上获取一堆像素并试图判断这是一只猫还是一只狗的问题了。 我们希望把这些图像当作与物理世界的通用传感器帮助我们理解世界的 和 结构无论是在物理空间还是生成空间中。 博士毕业后我做了一个很大的转变进入了 计算机视觉领域与我的同事们一起研究如何预测物体的 形状。
后来我对通过 数据学习 结 挪威 whatsapp 数据 构的想法产生了浓厚的兴趣。 我们讨论数据时常会提到获取 数据很难但实际上 图像是 世界的投影这里有很多可以利用的数学结构。即便你有大量的 数据你也可以通过这些数学结构推导出 世界的结构。 年是一个突破性时刻。我们的共同创始人 h 提出了 (神经辐射场)方法。
这是一种非常简单、清晰的方式可以通过 观测推导出 结构点燃了整个 计算机视觉领域。 与此同时 也开始崭露头角。很多语言建模的工作实际上在学术界已经发展了很长时间。即使在我的博士阶段我也与 j Kh 在 年进行了一些语言建模工作。 这其实是出现在 之前的事情但到了 - 的时代你在学术界已经很难再做这样的模型了因为它们需要的计算资源太大了。