「目前我们的方案是标准的CNN(卷积神经网络)思路。」徐力指着架构图分析道,
「将整张人脸丢进模型,经过卷积层提取特徵,最后生成一个特徵向量进行对比。」
「但这有个问题,模型似乎抓不住细节。比如双胞胎,或者长得像的人,它很容易搞混。」
「我觉得还是数据量的问题。」汤小鸥教授沉吟片刻,给出了学术界的经典判断,
「深度学习是吃数据的。相较于ImageNet动辄上千万张图,我们才几万张,模型根本吃不饱,泛化能力自然上不去。」
「我建议,扩大数据集。」
汤小鸥看向陈阳:「把数据量翻倍,甚至翻四倍。只有见过足够多的人,模型才能学会什么是不同。」
「同意。」
「附议。」
大家都觉得这是目前最靠谱的路径。
「好。」
陈阳点了点头,虽然他知道这会有提升,但不会有质变,但他还是支持团队的决定,
陈阳找来林小月叮嘱道:「通知星城那边,加大投入。我要5000个人的样本,至少20万张照片。」
「好的。」
又是半个月的煎熬。
星城团队像是上了发条一样,终于凑齐了这20万张高质量的人脸数据。
数据传回京城,新一轮的训练开始了。
这时候,算力的瓶颈赤裸裸地暴露了出来。
由于超算中心还在建设中,他们只能用现有的十几台伺服器跑任务。
进度条走得慢如蜗牛。
一天,两天直到第十二天,模型才终于收敛(训练完成)。
「这太慢了。」
顾书瑶看着伺服器风扇轰鸣,却依然缓慢的进度条,急得嘴角冒泡,
「一次叠代要十几天,如果有Bug重跑又要十几天。这简直是在浪费生命。」
陈阳站在机房外,看着这一幕,建立超算中心的想法从未如此迫切。