201 秦雨诺:他把我当问答模型了?

其实就跟拆箱一样,周岩已经迫不及待想拆开来看一下。

不过这种程序运行对电脑的配置要求挺高,周岩索性先回了酒店房间,把自己之前配置的电脑拿回来。

只不过一回到房间,周岩也不急着出来了,在房间里操作起来。

因为程序太大,周岩拿出了一块移动硬盘整体拷贝下来,一番捣鼓以后,他也打开了女黑客发来的封装文件包。

很快,程序运行。

依旧是黑色调,对话框什么都没有改变。

周岩首先输入了一个基本的算法需求,要求01编写出猴子选大王的代码,这是一个算法常例,用来验证初学者是否入门,也是学校常考的题目。

而01不负所托,在思考了几秒钟以后,很快就给出了代码。

女黑客发过来的代码本身就是在python运行窗口中,周岩把代码复制粘贴过去,窗口出现,周岩输入了几组数值,结果得出,完美运行。

周岩又修改了自己的几个要求,比如把猴子改成首尾相连,又去验证数值,发现依旧正确。

这个程序看来没毛病。

周岩又找了十几道难度不一的大厂面试题,他打算一道一道测试过去。

先从简单的开始,周岩把三道一口气放进去,让01回答。

结果不出所料,01都给出了正确的答案。

周岩感觉是女黑客把算法库加进去的结果,这种验证没办法测试出01到底有多厉害。

于是周岩提高了难度,把两道稍微困难的算法题贴进去。

这一回01‘思考"的时间久了一点,不过很快,依旧给出了答案。

周岩同样进行了答案验证,正确。

于是周岩也不耐着性子一个个放了,他直接把最难的那一道算法题放进去。

这种题目网上没有现成的答案,他也期待01的回复。

下一秒01回应的答案依旧完整,只不过在验证的环节出现问题,报错。

周岩把01的回答重新贴进了对话框,并告诉01错误,让他根据自己发过去的代码进行debug。

三秒以后,01又给出了答案。

只是验证的时候依旧报错。

周岩这一会儿变得极有耐心,一遍又一遍地把01自己生成的错误代码贴进问答框,让他自己纠正自己的错误。

而在纠正了差不多五次以后,01终于输出了正确的答案。

周岩知道这就是智能对话模型在完善答案的过程,同样也是未来智能模型的正确玩法。

本质上智能模型起的就是满足人类需求的作用。

一开始可能对所谓的需求只有一个模糊的概念,但随着交流的深入,智能模型也越来越理解你的需求到底是什么。

一个大的需求会包含十几个小需求,这十几个小需求一开始提问者可能并不知道,但随着和01沟通的深入,不管是提问者还是01,都能更加深入地了解需求。

这其实也是模拟人类交流的过程,当你提出问题的时候,不可能指望别人立刻进行回答,都是在明确对方需求以后,再给出进一步的反馈,越反馈越正确,因为你提的要求越难越多,对方需要寻找的范围也越来越小,越来越精准。

只是交流五次就回答出这个问题,周岩还是比较意外的。

于是他改变了思路,选择提出一个大项目,让01首先提供完成这个大项目需要的步骤。

而很快,01就给出了步骤,一共五点。

周岩给出的要求是:对网络文本进行文本统计分析。

01的回复是:1、导入文本。2、文本预处理。3、文本统计。4、得出结论。

比较简单,周岩给出具体一点的要求。

于是01的回复变成了:1、导入文本。2、对文本进行预处理,导入停用词表,使用分词工具对文本进行预处理。3、对处理后的分词文本,进行词频统计。4、对词频统计后的结果进行词频统计分析,得出结论。

具体了一些,只不过依旧有点儿宽泛。

不过周岩等不及了,

他直接提出让01根据自己的步骤,生成相关的代码。

而很快,01就生成了一系列的代码。

周岩下载了《斗破苍穹》的文本,对这段代码进行验证,很快就得到了不错的数据,虽然不全面,但显然这个项目是能进行下去的。

周岩又对这段代码提出改进要求,包括词频可视化,把词频用云图展现出来,包括对词频进行文本训练,从而找出词与词之间的关联。

这一回周岩提出的要求是对两本文本进行处理,两本分别是金庸老爷子的《神雕侠侣》和《射雕英雄传》。

很快01给出了相应的代码修改,周岩复制粘贴之后,进行测试。

其实需求也特别简单,就是找主角之间的人物关系。

杨过对应小龙女,那么郭靖对应什么,结果:黄蓉。

周岩又找了杨过和郭靖分别对应的关联词,同时让01局限在人物身上,自己设计一个人物词判定代码。

这一回01终于出现了一点错误,比如人物切分上面,会把4个词的人物变成2个词输出。

这就是细节上的毛病了,周岩现在也不是算法小白,知道怎么改进,不过周岩更期待01给出的结果。

于是他把这个问题粘贴给了01,而01也给出了对词频进行判定,如果两个拆分的词同时出现多次,那么判定两个拆分的词合并成为同一个词,并在字典中删除前面两个拆分词,并对已经分词好的数据进行处理,合并两个拆分词,没有分词好的就以该拆分词作为分词依据,照着分词就行。

粘贴进去以后,周岩发现效果意外的不错。

只是之后人物判别上也出现了一些问题,会把武器什么的加进去。

周岩又去问01,01回答了一些代码修改,但加进去以后,依旧是老样子,没法做到细致的划分。

周岩问01有没有什么好的办法,01说在处理之前,就把处理的人物给预设出来,这样就不会出现之后判定错误的情况。

也就是从源头解决问题,同样也算是一件很机械的处理方式。

但是人类有时候的处理,同样很机械,而且也是填鸭式的,就比如基因测序。

所以对于这一点也没办法太过要求什么,01做到这个程度,其实已经挺不错了。

周岩又预设了几个小型项目,并对01进行测试。

终于周岩也得出了一个结论。

那就是01已经具备了较复杂的代码作业能力。

更加专业的周岩自身实力有限,测试不出来,不过这个01用来应付小白显然没有什么问题。

测试完代码,

周岩又测试01的文本完整度,比如让01自己按照要求写一段话,要求包含出现的人物,以及事件,并呈现给他01思考的过程。

做这个的目的,周岩也希望能从中找到女黑客编写的算法逻辑。

而因为对周岩不设门槛,01也呈现出他的思路,包括对事件进行拆分,进行排序,然后进行扩充。

这样就得到了所谓的

人物行为序列。

具体的就是是这样:

a干了干什么,a干了什么导致b干了什么。

b说了什么,a说了什么。

b干了什么,b干什么导致c干了什么。

a说了什么。

b干了什么。

a说了什么...

大概就是这样。

然后对这些句子进行组合,通过自然语言处理进行更进一步的润色,比如宾状补之类的词义补充,就得到了最终的句子。

周岩其实也明白,后来智能对话模型之所以那么火,其本质原因还是不对外界呈现出相应的步骤。

相当于黑箱效应,这样就给人一种不明觉厉的感觉。

很神秘,也很厉害,也因此受到很多人追捧!

但这样的处理方式,本身就存在很大的操作(糊弄)空间。

如果你询问的是百科类的知识,人家早早就已经准备好了文本库,你问什么答什么,本质上还是搜索引擎的功能。

如果询问的是算法,同样,如果能拥有世界上所有算法的集合,那么对一些基本问题,智能模型甚至根本不需要调动自己的算力,直接就能给出答案。

这跟查字典真的没有什么本质的区别。

周岩真正想做的,其实是让机器理解人类的需求,从而实现文本到图片、到声音、到视频的跨越。

真正实现智能模型和工具的联动,拓宽智能模型的应用场景。

试想说出了什么指令,虚拟现实机器立刻给你呈现出相应的画面,甚至你的行为还能被判定,从而和画面进行对等交互,那呈现出来的效果,也将会是无比炸裂的。

就比如,涩涩电影,实景交互,前世里岛国就有发展这一方面的业务。

而人工智能,绝对能把这个业务推向一个新的高度。

索性四下无人,周岩于是让01生成一段涩涩描写,要求不少于三百字。

于是01在短暂的思考之后,很快就生成了大段大段的文字。

而其中的内容,更是有点儿...刺激。

01是不懂遮掩的,也不懂尺度的,所以呈现出来的,就是互联网上最原始的描写,但就是这样赤裸裸的描写、堆叠的文字组合,就有种特别的风格和韵味在里面。

哪怕文字的处理方面,依旧有点儿机械,但总体的需求,显然是能够得到满足的。

周岩甚至看这段文字。

冷静了一会儿,周岩又打开了01的说明书看了起来,里面显然是女黑客对01做出的修改注释和一些补充,而周岩也发现了01逻辑性变强的原因。

女黑客加入了一系列的数学方法,比如离散数学、递归、线性代数的理论,这些理论让文字的逻辑性得到加强,同时不容易出错。

换句话说,就是把文字关进了逻辑的框架内。

说起来这个女黑客数学水平真不是概的,哪怕周岩系统性的学过数学理论,但在应用方面,还真没这个女黑客厉害。

显然她就是曾经算法老师口中的‘别人家孩子",能够把数学和算法活学活用起来。

一般像这种人才,985高校的计院,基本都是抢着要的。

更不要说当时在进攻逐浪家园app的时候,这个女黑客能和张龙和顾远中等老牌程序员杀的你来我往,进退自如。

要知道顾远中的团队以前是专门做安全防火墙的,结果面对女黑客的时候依旧抓不到她的尾巴,已经足以说明问题。

周岩动了招揽的意思。

他打开了和女黑客的聊天

窗,发了条消息过去。

秦雨诺这会儿正在浙大创业基地,属于建邺大学的队伍办公室里,操作着电脑。

她喜欢安静,也因此团队给她分配了一间独立的办公室。

周先生:【01我看了,改的挺好的。】

秦雨诺看到周岩的消息,回道:【还是有些不完善的地方,不过我之前也说了,这不是一个人的项目,你如果想要更加完善,需要组建一个团队,对智能模型进行长时间的训练。】

周先生:【杭城有一个4G试点基地,你听说过吗?】

秦雨诺微微抿嘴,4G的消息她关注过,也知道正在进行全国试点,不过大多都是在沿海城市进行,就像杭城就有一个。

她回道:【听说过,但没了解过。】

周先生:【你觉得这个智能模型最好的应用场景在哪里?】

倒考起她了。

秦雨诺:【手机。】

这就是最为正确的答案,手机的便携性可以最大发挥出这种问答模型的作用,甚至如果数据库吸收的足够多,可以给任何分类提供相应的指南。

如果能做到细化,旅行、教育等都可以做进一步的发散。

周先生:【代码的应用场景,不是应该适合电脑吗?】

秦雨诺直接回复:【比较鸡肋,目前根本做不到大型算法的自运行,只能完成或者回答一些小问题,对于专业性的人来说,顶多就是一款debug和注释工具。】

周先生:【如果是手机的话,你觉得什么类型的应用适合承载这一款产品?】

秦雨诺微微皱起好看的眉毛,她歪了歪脑袋,没有立刻回答周岩。

所以,他,不会把她当成问答模型了吧。

(看完记得收藏书签方便下次阅读!)