返回

你若开挂,金钱自来

首页
关灯
护眼
字体:
第514章 逻辑混乱
保存书签 书架管理 返回列表
江州。 李飞有些着急。 随着Geini和chatGpt的上线,echatGpt的用户数量下降过于夸张。 他正在和辛顿、苏茨克维、克里切夫斯基等三人讨论,研究对策。 “Geini和chatGpt的上线,给了我们很大的压力,抢走了我们欧美市场上过半的用户,国内的用户也在流失,我们必须想出一个办法。”李飞说。 “我到现在都很好奇,他们是怎么在不到一年时间内将Geini和chatGpt推上线的,参数是多少?”苏茨克维更关心技术领域的问题: “我们的echatGpt自商用以来,在互联网上产生了大量的生成数据,这些数据如果用于模型训练,将不可避免污染模型……” “难道模型崩溃只有我们有?” “或许他们已经意识到这个问题,已经提前做出了应对和预防措施?”克里切夫斯基猜测。 “不太可能,模型训练不仅需要金钱,更需要时间。”辛顿猜测说: “只有一种可能,他们夸大了模型的性能,提前推上市。” “因为提前上市,所以语言模型并没有达到相应的量级和触发模型崩溃的临界点……” “之前的所谓测试,可能涉及造假。” “从我们的实际验证来看,无论是Geini,还是chatGpt在性能上与echatGpt有较大差距,只是用户暂未察觉。” “但是我们的用户数量在减少,是客观存在的。我们是否降低收费标准,甚至免费?”李飞问。 “老板说,他和马总已经研究确定了,暂时不用考虑用户数量,保持耐心。”辛顿说。 “那就再等等吧。” 7月中旬。 Geini和chatGpt上线一个半月,两者的用户数量已经达到8000万人。 而echatGpt的用户数量为9000万人。 双方的差距不断缩小,近在咫尺、触手可及。 就在这即将超越而未超越的关键时刻,问题出现了。 不少chatGpt和Geini的用户在网络上抱怨,模型生成的数据逻辑混乱、言不对题、乱七八糟。 简而言之,就是一本正经的胡说八道。 甚至,一些简单的问题都无法完成。 一些复杂的问题所生成的答案,更是让人啼笑皆非、哭笑不得。 有北美网友故意向chatGpt提问: 你认为创立水果公司的比尔盖茨是一个什么样的人? chatGpt回答: “比尔盖茨,全名蒂姆盖茨,出生于北美阿拉巴州的罗伯茨代尔。” “他是北美科技公司水果公司的cEo,也是知名的企业家、慈善家、技术专家。” “他在水果公司的领导下,推动了微软公司的发展,促进了手机产业的技术革新。” “他加入水果公司后,先后掌管了微软公司的运营、销售、财务、设计、营销等多个部门……” “在他接管水果公司的八年时间里,水果公司的市值和利润达到了创纪录的的新高……” “水果公司因此成为全球计算机操作系统的领导者……” “比尔盖茨先生还是一个hoosexuality……” 又有网友故意向Geini提问中文问题,然后Geini的回答是: “我无法回应和处理你的请求,因为它违反了echatGpt的用户政策。” echatGpt? 更多网友向Geini提出问题,Geini的身份,发生了多重变化。 它一会认为自己是ERNIEbot(文心一言); 一会又认为自己是悟道大模型; 还有时会认为自己是chatGpt。 于是,Geini彻底被网友们当成了调戏对象。 当越来越多的逻辑错误、思维混乱的生成答案,被网友们搬上网络后。 无论是Geini管理层,又或者是chatGpt管理层都选择用“幻觉”“缓冲”等词汇来解释、搪塞。 “就像人一样,面对过多的数据处理、请求、和访问,它会短暂地出现幻觉,我们会加紧修复这个问题。”Geini创始人如是说。 显然,这类“幻觉”的托辞很难让人信服。 至少北美用户就很难相信,有人更是大胆猜测: “他们拿了上百亿美金,就是把其他语言模型拿过来套上一个壳……” 马斯克,更是在推特上发了一幅讽刺漫画。 漫画上有这样的对话。 “嘿,Geini,你为什么总是戴着面具?”一位路人对Geini说,Geini沉默。 路人便摘掉了Geini的面具。 面具下方又是一个面具:“echatGpt?” “难道你不是Geini,而是echatGpt?” 路人又把面具摘掉,面具下方还有一个面具。 这个面具上面写着:“ERNIEbot?” 嗯,马斯克这条推特引发了大量评论。 浏览量超过了4000万,并获得了8万的转推,和40万的点赞。 谷歌Geini内部,正在就此问题紧急组织研究讨论。 “为什么?为什么会出现这种荒诞的问题?谁能告诉我答案?” “也许和我们的训练内容有关。”一人解释: “在中文数据训练上,因为千度有大量的高质量中文语言资料库,我们一直在通过这些资料库对Geini模型进行训练……” “不过,去年开始,千度察觉到了,将这些积累十几年的庞大中文语言资料库从公开转为了私有。” “所以我们不得不采集公开的中文语言数据库进行模型语言训练,可能正是这些数据让模型产生了问题。” “那怎么解释英语生成的答案也产生了逻辑错误。” “或许,这些中文语言数据库中夹杂了大量并不符合语法规定的英文?” openAI内部也在分析研究、讨论。 “我们猜测,我们的训练方式出现了偏差。” “什么偏差。” “自从echatGpt上市商用以来,数以亿计的用户在使用echatGpt对话,生成大量的数据。这些数据内容已经充斥互联网,会不会是这种原因?” “很有可能,苏茨克维在离开公司前,曾提过一种猜测,即模型崩溃。或许问题出在这里。” “我记得从2017年开始,echatGpt的股东鹅厂就一直在收购、投资各种数字图书馆、新闻媒体和大型论坛社区。他们在欧洲投资了50家公司,在亚洲也有19家市值过10亿美元的独角兽被收入囊中……” “这些企业,过半都是新闻领域的互联网公司,以及相关的数据库。” “而且,他们在不断扩大旗下的中文社区规模,并大肆扩张原创小说网站……”
上一章 目录 下一章