Abstract
搞 AI 的人到底在搞什么
AI 从业者或科研者通常完成 3 类工作:
- 第一类是基础性的,他们考虑:
- 如何让训练结果更有效;
- 如何让训练的准备或过程更高效;
- 如何更正确地评估模型效果;
- 如何让训练结果具备更强的性质(例如可解释、可迁移、自我改进等);
- 全过程的数据安全和伦理问题。
- 第二类是数据处理,他们:
- 对大量数据做清晰、特征提取、增强等处理;
- 在监督学习中,基于会向训练过程提供的数据,以及期望得到的训练结果,设计和完成对数据的标注。
- 第三类是应用性的,他们:
- 发现和定义问题;
- 分析技术选型;使用大量标注数据,探索训练算法和参数,尝试得到一个有效的模型;
- 迭代以得到效果更好、需要资源更少、延迟更低的模型。
训练得到的模型就可以用来解决问题,例如识别文本、预测股价、生成图像等;这个过程称为模型的推理 (Inference)。