太阳高悬天中。
数人围坐一旁。
一个戴眼镜的男子推了一下自己的眼镜。
“一个数学家来做我们的项目组长,靠谱吗?”
“应该靠谱吧,盛名之下无虚士。”
一个虽然年轻,但是已经有了飞机场的女子说道。
“许晴,程岩,我们在背后讨论组长不好吧。”
一个微微秃顶的男子说道,正是昨天问苏航的那位格子衫男子。
“怎么说也是咱们未来的组长啊。”
许晴轻笑了一声。
“隔行如隔山,一个数学家来我们这行开发项目,这未免有些不合适吧。”
“李棠,别被他的名头给吓到了,苏航他在数学上的成绩我们无法否认,但是,他在软件开发上可未必有我们强。”
程岩推了推眼镜。
“我看过苏航的论文,他也有过软件开发的经历,是一个revit的插件,专利版权只有他一个,也许,他还是很强的。”
“不过,我们在麒麟软件已经有过数年的工作经验,我觉得,苏航在这一方面,应该不如他在数学上的成绩。”
“可是……”
李棠摸了摸他那要秃的头顶。
“昨天我打听到,他已经开发过一个成熟的语言模型了,他的那个小程序你们玩了吗?”
“是一个剧本杀的游戏,我在里面经常遇到一个女网友,昨天苏航居然告诉我,那个女网友居然是他写的语言模型,和真人互动就是在训练……”
李棠绘声绘色地描述那个语言模型。
“然后,据他所说,这就是他将要做的项目。”
程岩推了推眼镜,若有所思。
许晴依旧不屑。
“个人开发的语言模型能有多强。”
她双手抱胸,一马平川。
“语言模型需要大量的数据作为支撑,前段时间OpenAI发布的GPT-3,就经过了0.5万亿个单词的预训练。”
“它使用的最大数据集在处理前容量达到了45TB。”
“这是什么概念?”
“平常人想要独自完成这样一个语言模型,逐字逐句去训练,一辈子都完成不了。”
“更何况这些数据集还需要经过预处理。”
许晴摇摇头。
“我觉得还是不要抱太大希望。毕竟带一个项目来镀金的也不是没见过,凡是多问问老部长才做吧。”
其余两人问言点点头,没有反驳。
他们出自麒麟软件公司,自然清楚这类语言模型的开发。
很多时候,体量代表一切。
任你算法无双,
任你模型一流,
任你风华绝代,
几十TB的数据集砸下去,再次的模型也会被调教的妥妥贴贴的。
口径即正义,体量即真理。
在算法没有质的飞跃时,评判指标有时候就是那么简单。
所以在这种情况下,三人都一致认为单独的个人是开发不好一个语言模型的。
至少比不上主流的语言模型。
至于苏航到底是不是来镀金的,到时候自有分晓。
混迹职场数年的老油条们,自然有自己的处世之道。
要是上司想混,他们也乐的清闲。
更何况,他们只不过是来联合开发的。
名义上属于研究所,但是工钱、职位还是在麒麟公司。