周六清晨,窗外鸟儿叽叽喳喳。
唐念躺在床上,盯着天花板进行灵魂三问:能不能不起床?能不能晚点起床?能不能直接请假?
问到最后眼前浮现出的是大魔王那张冷到结冰的脸。
答案肯定是不能!
唐念灰溜溜爬起来。
上辈子作恶多端,这辈子早起上班。
陈知礼发的三篇论文都是nlp领域近五年内经典论文,第一篇是关于处理预训练模型,以及如何训练它们产生符合人类偏好的文本。
唐念英语水平不算差,高中时候比陈知礼要好很多。但她荒废太久,看的仍然很吃力,尤其是前面的引言和背景部分,一长串晦涩难懂专业词汇令她头疼到炸。
她只能逐字逐句粘进有道翻译,给每个名词做好注释,最后组合起来……还是看不懂。
谁能告诉她这是什么意思:“我们有一个不错的方面,一个比对手大的对手和输入句子随机假面其中的单词,同时被预测出上下文不一致的问题。”
这根本就不是人类语言!
带上痛苦面具。
杨蓁蓁的闹钟是七点,她打个哈欠坐起来,下床就看到桌前抓耳挠腮的唐念,一度以为自己是在梦游:“太阳打西边出来了,你怎么起这么早?”
“做噩梦了。”
“什么噩梦?”
“被前男友追着看论文。”
“……”杨蓁蓁:“你这前任真可怕,梦里还push,可想而知你以后会是个多么悲惨的小女孩。”
唐念幽怨的看她一眼:“快救救我,有没有什么快速阅读论文的好方法,比如把芯片插入脑子,自动读取?”
“那倒是没有,”杨蓁蓁不由笑了:“不过我有法宝。”
唐念眼睛一亮:“什么法宝?”
杨蓁蓁:“我自己训练的翻译机。”
唐念想起刚刚驴唇不对马嘴的有道翻译,半信半疑:“能行吗?”
“我可不是跟你吹牛逼,我这翻译器和外面那些乱七八糟的机翻不一样,是我亲自一点点训练出来的,除了遣词造句外还能自动抓取表格和图片,一键提炼要点和结论,写概括和总结。口说无凭,你先发我一段,我给你打个样试试。”
唐念把头点成捣蒜机:“好。”
她特意从论文中挑选了一段巨长的包含定语补语还附带图表的专业句子发给她,没一会,杨蓁蓁把汉语翻译发过来了。
唐念一看,意外的语序很通顺,流畅简洁,图表还会运用中文通俗谚语帮助理解,这水平简直秒杀95%英专生。
唐念惊呼:“好厉害。”
杨蓁蓁洋洋得意:“是吧,这可是我大学三年的心血之作,我给它取名叫‘蓁言蓁语’。”
唐念:“怪不得霍金大大警告我们,一旦人工智能发展到完成程度,人类的终结也就到了,你这简直逼死英专生。”
杨蓁蓁:“别太悲观嘛,我们要信奉AI协作而不是AI威胁,语言本身是多样化的,AI只会模仿,人类才会创新。”
不愧T大高材生,PUA都比别人专业。
唐念笑说:“你把代码发我,我本地部署一下,玩玩。”
“OKKKK。”
解决掉翻译这一难题剩下的就简单多了,唐念照猫画虎把论文中算法复现了一遍,跑了跑,对错不管,只要没BUG完事大吉。
组会是周一下午,这次算神农1.0课题组立项后的第一次正式会议,学院挺重视,邀请了院里大佬过来坐镇。
唐念来的最早,挑了个角落趴着玩手机。
学术报告厅陆陆续续进来人,没一会她旁边坐下个女生,前排男生的目光绕教室扫了一圈,最后定在她的位置,鉴定是个美女,去小群讨论了。
猴哥:【快看三点钟方向,咱实验室来了个美女。】
祝总:【大师姐旁边的女生?确实很漂亮,但你也只配看看,这种女生修炼几年又是个神挡杀神佛挡杀佛的影响因子收割机,你搞不定的,调参侠。】
超帅:【我4篇sci在手还不能让她对我多看一眼?】
猴哥:【除非给一作。】
超帅:【命能给,一作绝不可能。】
一帮人在桌下聊的兴奋,旁边女生也凑过来找她搭话了:“你好,小师妹,我叫盛园,今年博三,我坐你旁边不介意吧。”
女生穿着一身休闲装,扎着利练的高马尾,笑起来还有颗反差感极强的小虎牙。
唐念:“当然不介意,我叫唐念,研一新来的。”
“新来的哇,那我可得好好给你讲讲规矩。”
“规矩?”
“就是咱们实验室来的新老板,杨院士的得意门生,从MIT挖回来的,虽然才二十八岁,但已经是正高级研究员,学术成果整页都罗列不下,性格也雷厉风行,杀伐果断的,最讨厌学术不端,上班摸鱼这套,你平时可得小心一点哈。”
额……
讨厌摸鱼,真巧她最擅长偷偷摸鱼。
唐念笑着应下:“我会注意的,谢谢学姐。”
盛园对这种长相可爱的妹子最没抵抗力,她双手捧着脸颊扭了扭身子,夹起嗓子:“哎呀叫学姐多见外,咱们同门都喊师哥师姐,你和他们一样叫我大师姐好了。”
唐念:“大师姐。”
盛园笑眯了眼:“你好你好,小师妹选课了吗,要不我给你推荐一下专业课,研一打基础还是挺重要的。”
“我已经选好了。”还都是影视鉴赏呢。
“这样啊,”她看了一圈会议室,清一色的男生:“咱们实验室好像就咱俩女生,要不加个微信?”
“好啊。”
“嗯嗯,大群里的‘程序园’就是我,第三个蓝色头像的,你加我吧。”
两人互相加完微信阶梯教室也差不多坐满了,先是韩琦教授上台讲述background,和【神农】项目的远期目标。
韩琦教授今年62岁,是西苑医院主任医师、教授,医术精湛,专治各种疑难杂症,被誉为“京北国医大师”。
相比于西医,中医其实更复杂,以阴阳五学为基础,将人看成“气、神、形”的凝聚体,通过望闻问切来诊断病因[1]。
随着西方医学爆发式的发展,中医的地位和影响力逐渐下降,网络还出现了一批“中医不亡,中华不兴”的反中医者,一度让不熟悉中医的年轻人认为中医是迷信、玄学、伪科学。
韩琦教授对此痛心疾首,中医明明是中国历经数千年沉淀和实践的医学,是一种经验医学,而经验类数据是最适合AI训练的,这是韩琦愿意接受神农项目的原因。
所以他代表西苑医院并联合全国420家中医院及中医堂提供数万套医学古籍、医药病例、经络、穴位、脉象、舌像等各种经验数据来辅助绘制知识图谱。
“未来国医兴起指日待。”
现场响起掌声一片。
陈知礼坐在第一排,破天荒带了副银框眼镜,掩盖住周身凌厉的气场。他周围坐得都是院内大佬,几人似在交谈着什么,偶尔惋惜地摇摇头。
韩琦教授的开场词说完,陈知礼被邀请上台讲话,他站在立麦前,淡淡环视一圈,也没见手里有发言稿,直接开口说话。
“我是神农1.0课题组PI,陈知礼。”
没有过多问候和寒暄,开门见山的自我介绍,却足以吸引所有人的注意,台下再度响起热烈的掌声。
让唐念不禁回忆起高中在贴吧看过的一篇采访,那时她也听到过这样的声音。
低沉,自信,悦耳。
他穿着红白相间的夏季校服,懒懒散散地站在附中南门的牌匾前。
“我是高三实验班的陈知礼。”
这次采访的是获得区内优秀作文的同学,陈知礼按理说不应该获奖,因为他语文很差,尤其作文,经常有病句,但教导主任坚持让他报名,还专门让语文年级组长给他写的稿子。
这件事当时在校内传的很难听,说他靠关系走后门之类。
《怀念我的将军外公》
看到这题目,陈知礼自己都差点笑出声。
他出生时外公已经年近耄耋,老爷子身体很差,做过几次大型手术,住在专业的疗养院,他一年最多见一回,他都不知道自己要怀念什么,疗养院的消毒水味?
主持人对着摄像机讲完开场词,把话筒递过来:“不知道陈同学的外公看到这篇作文是什么样的心情?”
陈知礼扯了扯唇,对镜头露出一个饱含嘲讽的笑:“不好意思啊,我不太清楚。”
“是因为高三学业太忙,来不及告诉他吗?”
“那倒不是。”
“那时因为?”
“因为我外公已经死了十年了。”
“……”
“你要真想知道,可以自己去下面问问他,不过我建议你最好不要,我外公脾气不好,最讨厌溜须拍屁。”
“……”
估计是意识到自己这话多少有些大逆不道,陈知礼后面的态度明显端正了,发言也根正苗红:“我外公的确战功卓著,成绩斐然,但那都是过去式了,未来的我们亦能兵锋所指,战无不克。”
这段语出惊人的采访当然没被采纳,事后陈知礼被教导主任劈头盖脸一顿骂。
他很无辜:“我说的是实话。”
“但你怎么能用这么“死”这么不尊重的词形容你的外公,他是我们国家的英雄,我是让你缅怀英雄,稿子都给你写好了你不背,你是不是想气死我?”
陈知礼默了会,眼皮耷拉着:“意思是我这么说不礼貌?”
“你也知道不礼貌!”
“那我换个说法,我的外公已经驾鹤西去十年了。”
“……”
唐念是从学校贴吧看到的同学上传的视频。
少年桀骜不驯,单凭一道足够有穿透力的声音,就能听出其中不可一世的傲气。
“未来的我们亦能兵锋所指,战无不克。”
那一刻,就连胸无大志、浑浑噩噩的唐念都不得不被他身上这种刺目的光芒所感染,变得热血沸腾。
唐念抬头看向讲台,八年过去,肆意轻狂的少年成长为男人,声线也变得沉稳冷静。
兵锋所指,战无不克。
他做到了。
陈知礼的发言很简单,只寥寥数语:“下面由我的团队成员唐念同学做第一次文献分享。”
听到自己名字,唐念有些恍然地从记忆中抽离,赶紧抱着笔记本电脑上台,还因紧张差点被台阶绊了一跤。
唐念拿起HDMI接口插入笔记本,背后大屏映射出她的屏幕,她操纵鼠标点开准备好的PPT。
“我今天分享的文献是预训练模型,”她咽了咽喉咙,继续照着文稿往下读:“预训练的目标是预测一段句子的下一个单词……”
和陈知礼的演讲不同,自她上台,下面就没几个人认真听了。
可能是她这篇论文选的太基础,又有珠玉在前,前排大佬们明显兴致廖廖,交头接耳聊着天,互相吹捧和交流业界的新模型了。
唐念也想加快速度,PPT翻的飞快,点到某一页时,下面突然一阵骚动。
大佬们的交流声逐渐止歇,眼神怪异,欲言又止的望着她。唐念的解说也慢下来,莫名有种错觉,似乎从大佬们眼中看到自己脸上的“道德败坏”四字。
难道是她讲的太差给学校丢人了?
不至于吧。
唐念又把目光移向中心位的男人,陈知礼倒是比其他人淡定得多,窗外阳光有些刺目,他微眯了眼,视线轻轻掠过她,最后落在她身后的PPT上,眉梢动了动。
虽然他表情管理做的非常好,但她还是看到了他脸上微妙的表情变化。
“?”
什么意思?
唐念有些迷茫地顺着他的目光缓慢扭过头,等看到PPT上的翻译,脸色以肉眼可见速度变白了。
【厕隐经我,一手笑颤口口口口口口……】
“?”
这是些什么!!!
作者有话要说://某文切分词,为什么是这种词,下章详细说。