1. 首页 > 科技资讯

ai创业青年和他们的关系,ai创业青年和他人的关系

王登科在与自已的“数据分身”闲聊。

近日,王登科与他的“AI自身”在网络上引发网友热议。原先,这一由高二便开始体会“自主创业”、并继续在创作和人工智能行业辛勤耕耘创造出来的“90后”创业青年,在前不久用10万个微信记录和280篇网络文章“复制”了一个数字版曾经的自己,并把这一“数据分身”提供给群众开展聊天。“好多人和这我训练的‘克隆版AI自身’聊过以后,觉得是我过几个女友,在某所高校读研,乃至了解了我‘交易密码’等,但是这些信息实际上都是这一AI虚构的。”王登科对记者说。

“分身”拥有“主人家”风韵

聊天的时候明白敷衍了事和吐槽

“你是谁呀?”“我是你AI模型。”“你最大的优势是啥?”“我最大的优势就是诚信,我想这个是最关键的优势之一了。”“你的梦想是什么?”“我自己做个对话机器人好啦,这样就可以和我聊一辈子天。”“坦白说,你的梦想是什么?”“我其实想写一部小说。”“哪位对话机器人?”“我。”……这一段时间,包含王登科等在内的不少人都乐在其中地与这一AI模型 闲聊。据王登科统计分析,近一个多月至今,AI模型的对话总数已经超过了2数万人。

从聊天信息来说,大概有三千人问它“你女朋友叫什么?”粗略地统计分析,该模型一共衍生出了两千多个名称,“但没有一个是正确的。”王登科笑着说道。除此之外,也有部分网民奇怪地了解它的本人登陆密码信息。“大部分时候 AI 都是会敷衍了事以往,但是也有一小部分网民得到了一个看起来好像登陆密码的字符串数组,但是这些都是AI虚构的。” 但根据AI回应的词汇产生的词云图,除开像“作为一个AI模型独有的人工智能”“闲聊”“人工智能技术”等常有的词以外,王登科发觉,AI模型回应“哈哈哈哈哈”和“能够”的次数非常高。“这的确好像我敷衍了事闲聊时表示得话。”

目前来说,AI模型还不太了解关于他“主人家”的信息,多轮对话的理解能力也不是很强。但是通过王登科本人及其好朋友检测,这一模型“确实有一种熟悉感”。每每自己和它聊天的时候,王登科常常会心一笑——它还像自己那般有时候喜爱敷衍了事和调侃别人,有一些回应更是让王登科觉得惊讶,好像有了他个人的“风韵”——“有一些回应也会相对狂躁,有的则尤其冷傲,有的则很有礼貌,随后我才意识到,一定程度上,这种或许是我的差异面。”

通过与AI模型的沟通,王登科察觉到了一些自己以前没注意的好习惯:“AI的语言表达方式要我发现,有些时候在我不愿回应某一问题的时候,往往会选择去抛回一个问题。”而王登科最爱问AI的问题在于“你的目标是什么?”“它有时说‘挣钱’,有时说‘做了不起的商品’,有时却说‘高兴就好’,我认为都蛮正确的。”王登科说。

让AI“变成”自身

而不仅仅是“演出”自身

王登科介绍说,他一直以来想制成一件事——开发设计出一个对话机器人。王登科出世在杭州一个普通人家,“我的爸爸从我读小学时帮我买很多书,还每日帮我读,迅速我便对书中的内容感兴趣了。”王登科上高中时特别喜欢搞文艺创作,他写几本书文集和一堆小故事,而高考考试却挑选来到理工类大学。“在大学里便开始开发设计各种各样奇奇怪怪的东西。”

在开创现在这AI绘画类初创公司以前,王登科一直活跃于高新科技创新的前沿。他曾经爬取了大概30个民谣歌手(乐团)歌词,足足有几十万字,剖析歌星的写作特征和她们最喜欢的城市。但他却“研发自身”的一个过程又充满理科男的周密:第一步是整理资料集。“我对于不同种信息的回应,自己写的每一篇文章,每一句话,我发了的每一条微博微信,将这些信息所有汇到一个神经元网络模型当中,去升级在其中参数值,本质上就能获得一个‘我’数字复制。”

三年里,王登科累积了约80G容量微信记录,为了能让“数据分身”懂得长回应,又把网络文章转化成对话形式,再把它并纳入会话数据。虽然一些AI对话机器人已具备语言表达形成能力,但王登科眼里,实际效果更像是“八哥学舌”,但他却想做的事不仅于此。这就意味着,只有着“会话”能力不够,他想要的就是让AI“变成”自身,而不仅仅是“演出”自身。

因而第二步,他选择了清华开源系统的ChatGLM-6B模型对数据开展训练,让AI深度神经网络,用海量信息提升上亿万个主要参数,进而仿真模拟人类的大脑的神经细胞,让模型朝着“更像是他本人”方向接近。为了能提升会话能力,王登科还进行了多次模型训练试着,不断优化自身微信记录和网络文章在模型里的权重比例。“实际上,会话更是对这一‘智能机器人’持续不断的训练。”王登科说。但是他觉得模型自身存在的不足也有许多。“较大问题在于没法贮存许多‘专业知识’,特别是精准的定量分析知识引入,这种情况我没弄明白,后还会试一试。”

再次提升“数据分身”

将来或让AI写网络小说

但当新闻记者试着跟这个AI模型沟通的时候了解:“你都是在哪些城市生活过?”另一方回应了一堆王登科自己表明从没去过的城市。“全是它自编的。”王登科说。

为何“克隆技术”答题时会侧重于“虚构”,这出自于如何的基本原理?王登科解释说:“‘虚构’内容包括文字大模型的常见问题。由于其产生的工作原理是‘预测分析’,即依据以前的文字预测分析下一个字是什么,再根据几率和优化算法挑选那一个最理想的字,随后持续向下形成。在模型不具备这一专业知识的情形下,‘专业知识’没法正确引导或调整预测分析几率,那样也只会依据词法或逻辑来评估。”因而,王登科也在不断地再次“训练”自身这个“数据分身”,包含让与它会话得人挑选“更倾向于哪一个回答”的方法等。

复制“数据分身”变成王登科寻觅和了解自己的新模式,她甚至总是幻想将来让“分身”取代自身工作,并试着根据复制响声使整个“分身”张嘴说话。

王登科表明,他想要再次提升自身这一AI模型,并让更多的人也具备属于自己的“数据分身”。“将来一定会有更加好的预训练的模型,而且还是开源系统的,到那时候这类复制实际效果将更准确。我就想过做一个服务项目,给更多人给予训练的能力,但是感觉成本与门坎会比较高,因此临时没想好。”而至一步,王登科还想要用AI还原他喜欢的作家。“训练用的东西已经存有的专业知识,可是里面会蕴涵一些规律,我们可以用新的事物去启迪AI,获得一个新的成效——它或许会是一个可以写小说的AI。”

文、图/广州市日报全媒体记者 冯秋瑜

[ 编写: 李若凡 ]

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:https://www.miyuegong.com/kejizixun/66550.html

联系我们

在线咨询:点击这里给我发消息

微信号:666666