新闻动态
NEWS
国双知识智能专家解读:ChatGPT是产业数智化的未来吗?
最近一段时间,ChatGPT可谓火爆全网,自发布之日起,5天内涌入100万用户,2个月内注册用户数达到了1亿,迅速引发全球AI能力的新一轮热潮,国内各个行业的圈层都对其高度关注,那么,到底什么是GPT, 他确实像大家理解的那样“厉害”吗?首先,让我们来再次认识一下ChatGPT及其原理:
ChatGPT的自我介绍:
从其自我介绍可以看出,ChatGPT是OpenAI推出人工智能聊天应用,它以对话的方式进行交互,根据用户的输入进行内容的“检索”和“语言组织”后将结果输出给用户,并且能够根据对话的上下文进行极为接近人类自然交流的互动。
“ChatGPT仅仅通过文本来认识世界,它认识的这个世界相比于我们实际所处的世界肯定相对来说比较贫瘠”——美国计算机科学家 吴恩达。
在技术原理上,ChatGPT是基于GPT-3.5(Generative Pre-trained Transformer 3.5)架构开发的AI对话模型,与GPT一样,是根据输入语句,预测下一时刻不同语句(或语言集合)出现的概率。与GPT-3的主要区别在于,新加入了被称为RLHF(Reinforcement Learning from Human Feedback,人类反馈强化学习),这一训练范式增强了人类对模型输出结果的调节,对结果进行了更具理解性的排序,通过人类干预来增强机器学习以获得更好的体验效果。
ChatGPT爆火出圈,这种流量拥趸带来的商机令业内企业乃至资本市场为之振奋,AI技术又现风口,随之而来的还有乘风而起的概念企业股价。同时大众对AI替代多种专业人才的讨论再一次喧嚣尘上。那么ChatGPT真如大众想象的那么“强悍”吗?为此我们又就产业中的不同领域深入测试了一下:
根据上面的简单问答,以及各个渠道的数据调研对比,我们大概可以推敲出以下几点:
会话沟通能力是优势:ChatGPT的会话交流和沟通能力是比较好的,取决于大模型,其对语言的理解能力相比较与以往的AI模型有了很好的体验提升。
及时性和准确性欠佳:ChatGPT给出答案的及时性存在不足,当然这是可以理解的。由于其训练基于的数据集是截止2021年的数据,所以给出的数据并不是实时的,可以看出其技术依然受到底层数据来源的限制。但即便如此,其在能力范畴之内的准确性仍存不足,如上述关于油气生产的问题,给出的回答十分概括,缺乏精准信息。
ChatGPT在开放条件下进行闲谈聊天几乎可以“自由发挥“,对话体验十分拟人。但是要将其回答作为报告引用及依据是否可行呢?ChatGPT能够实现在产业级的规模化应用吗?我们来分析一下:
首先,从场景需求上,产业应用需要将产业数据进行治理,给产业分析和决策提供支持,因此其结果必须是准确可靠的。而当前ChatGPT的数据来自互联网,网上的数据真真假假,官方发布和小道消息融合掺杂,无法有效辨别。因此,想提升准确性,这恐怕仍然需要将海量数据进行准确标注和融合的大量工作。
其次,从安全性上,企业生产数据是企业的核心机密,对隐私合规有很高要求,有的甚至关系到国家信息安全,必定是不能随意发到互联网上的,本地化训练和部署仍是刚需。而ChatGPT目前并没有开源,所以从可行性上存在一定的壁垒,就目前情况来看很难实施。
再次,从算力成本上,以GPT-3为参考的话,其训练成本约为460万美元。ChatGPT和GPT-3.5均在微软Azure AI supercomputing infrastructure上训练得到,训练耗时和成本均未公开。但考虑到GPT-3.5的参数量会多于GPT-3以及优化增强标注和训练所需的人工反馈,成本推测会更高。
由此,ChatGPT要实现产业化、场景化落地,现在来看还有比较长的路要走。以国双十余年来在产业应用的实践经验来看,技术及产品研发和在业务场景中可落地之间,通常需要历经多轮打磨甚至承受对原本设计可行性的严苛挑战。特别是国内产业级的数据庞杂,数据质量参差不齐,首要仍需要在现有信息化基础之上搭建起有序的数字化底座,进而再进行智能化赋能和构建智能化应用。在这个过程中”数据“和”知识”双要素缺一不可。提到“知识”又不得不提及知识体系的规划和构建,在产业级知识体系规划和构建过程中通常需要分为两条线,一条是与行业专家、领域专家对话,从理论到行业自上而下来进行规划;另一条是与信息专家对话,自下而上进行验证,这里的验证一个是基于事实的数据,另一个是基于上层的应用场景,看它后续要做哪些分析。两者结合进行才能构建良好的数智平台,也才能真正让AI技术落地和产业相融合。
作为一家国产企业级数智软件厂商,国双坚持深入产业,坚信以实际业务需求为准绳打磨出的技术产品才是合格产品。如今,国双已沉淀出完全自主的大数据平台、知识智能平台和工业互联网平台等多种平台级产品,以全域数据治理分析为基础,综合应用了包括自然语言处理、知识图谱、机器学习、深度学习等在内的诸多AI技术。并在此基础上开发发布了能够进行模型构建、数据标注、知识抽取、计算和应用的完整工具链,实现了从数据到知识、到应用、再到优化的知识全生命周期使用和管理。未来国双仍将深耕数智软件研发,使自研产品在准确及稳定的基础上横向拓展更为多样化的产业场景,助力产业转型升级,为数智化转型贡献国双人的智慧与力量。