首次沟通前无需准备完整需求文档,先明确目标、样本与当前约束即可。
视频理解、Omni、后训练、评测,或者其中的某一个子方向。
视频库、字幕、音频、metadata、已有模型输出,或者一部分 benchmark 素材。
训练集、偏好数据、benchmark、人工评审,还是 schema 和 QA 流程本身。
先做 PoC,小批次专项项目,或进入长期数据工厂合作。
先小后大,先验证再扩产。
条样本作为第一批验证范围
完成初版 schema、样例和 QA 对齐
常见交付:训练集、偏好集、评测集
围绕启动方式和需求准备的常见问题。