,预测下一个时刻不同语句甚至语言集合出现的概率分布。
在这个基础上,再使用来自人类反馈的强化学习进行训练,这种方法通过人类干预来增强机器学习以获得更好的效果。
在训练过程中,人类训练者扮演着用户和人工智能助手的角色,并通过近端策略优化算法进行微调。
程旭介绍了一番现在的基于概率和强化训练的语言模型逻辑,接着他话音一转:
而基于荷泵芯片本身的强大多值逻辑处理和智能水平,2041实验室有一种新模型,它不再是基于概率的,而是基于常识的。
简单说,我要教他说话,不再采用海量数据分析后续文字出现的概率,而是教它识字组词造句,然后句子的组合形成具有一定逻辑和观点的段落和文章。
技术实现的细节当然不是如此,只是程旭这个时候不可能跟李泓说什么技术细节,只能是打了这么一个比喻。
而李泓也确实理解了,一方面他曾经就是技术人员,都模型训练也有一些了解和研究。另一方面,程旭的话也足够通俗易懂,听起来,这方法就跟教孩子差不多。
如果这真的能实现,那真是的比基于概率的语言模型要强百倍千倍不止。
李泓的眼神瞟向了旁边的专家,专家会意:以现有的荷泵芯片的水平,也就是价值判定芯片的逻辑,是不够的。
现有的不够,那新的呢?
现有芯片就是程旭荷泵体系的极限吗?一个新的东西,刚出来就是极限?还是龙潜于渊,即将一飞冲天?
一般情况下,接下来就是需要专业人员进行技术评估的时候,但自己这边压根就搞不懂别人的基础,评估也很难评估出个所以然来。
现在就需要李泓自己做决定,这种决定其实就是某种意义上的豪赌。
他稍微一思虑,再想想程旭这个人,这绝对不能以常理度之。
这种豪赌绝对值得,再说了,一点儿钱而已,又不是关乎生死存亡的事情。
更关键的是,程旭并没有表现出想要千寻投资的意思,就算给钱,那也是自己上赶着的,人家愿不愿意要还是两说呢。
李泓也是不再纠结,直接提出了后续合作的话题:程工的想法我能理解,为了保证自己的话语权确保未来的发展方向,思路也确实是可行的。
但,这种审批肯定需要很长的时间,是一个很长的过程,而且,在没有真正做出成绩以前,也很难获得大众认可和支持。
你看这样如何,前期这个项目就先由千寻来出钱,就还按你这个思路,你就当我们是你众筹的对象,只不过出资的人由个人变成了我们。
我们还是只享有收益权,一切完全按照你的思路来,就当先为以后的操作做个试点。
嗯,确实不错。
程旭的想法是一个长期规划,短期内肯定很难实现
请收藏:https://m.bj11.cc
(温馨提示:请关闭畅读或阅读模式,否则内容无法正常显示)