新闻动态
NEWS
国双:扬帆正当时
由大数据、人工智能引发的科技革命,正在重塑全球产业新格局。许多人相信,这就是人类级别的智能应用,并且终将超越人类,但在国双董事长兼CEO祁国晟眼中并非如此。
“就像引发了令人震惊效应的Alpha Go事件一样,其本身应用的只是人工智能的一部分——深度学习,而这一技术还有很多局限性,比如经常会产生偏见、非常容易被误导性样本影响、无法完成特别复杂的任务等。要让机器真正像人一样具有理解、思维的能力并为产业服务,还需要更多人的参与才行。”祁国晟说道。
作为国内起步最早的企业级软件提供商之一,国双亲历了人工智能在大数据时代的崛起和兴衰。与大众对待陌生高新技术的忧虑不同,真正技术的缔造者无疑显得更加清醒与客观。在国双看来,技术的价值最终还是体现在为人类服务上。今天,人工智能虽已成为世界各国竞争的关键领域之一,但离解决更多的实际应用问题还有很长的距离。这其中,作为技术与产业的连接方——企业级软件提供商的作用无疑显得至关重要起来。当各行各业面临数字化转型的关键阶段,属于To B型软件企业的春天才刚刚开始。
大数据让人工智能焕发新生
很难想象,在21世纪的今天被炒得沸沸扬扬的新兴技术——人工智能,其实早在半个多世纪以前就已经出现。并且,无论是世界上第一个聊天程序、第一代机器人产品,还是最早的无人驾驶汽车、第一个连续语音识别程序,都是在这段期间先后涌现。但直到现在,人工智能才开始进入大众视野,其由为何?
“技术的价值其实就在于它的实用性,如果不能为人类创造价值,再先进的技术也无法被人们所接受。”在祁国晟看来,改变人工智能实用性的关键转折点其实就在于大规模数据集的出现与存在。
半个多世纪以来,人工智能这一新兴领域着实让无数科学家伤透了脑筋:很多难题明明理论上可以解决,看上去也只要少量的规则和简单的步骤,但结果带来的计算量却是惊人的增长。即使是让计算机识别一张婴儿图片,也必须建立在数百万张图像之后才有可能完成。而在计算机和互联网都没普及的时代,如此庞大的数据收集根本无法完成。并且,有科学家算出,要用计算机模拟人类视网膜视觉至少需要每秒钟执行10亿条指令,而这样的计算量在当时根本不可能实现。要知道,在20世纪80年代,世界上最快的计算机速度也不过每秒1亿条指令,而普通电脑计算速度更不到每秒一百万条指令。但在今天,大数据却解决了困扰人工智能几十年的难题。
“什么是大数据?其实就是数据量多到一台电脑已经无法处理,必须依靠多台服务器,也就是分布式计算才能完成。” 祁国晟说道。
在他看来,大数据的基础主要体现在两方面:首先就是分布式计算,通过多台计算机同时处理的方式可以突破摩尔定律的限制,即短时间内就能解决庞大的数据量计算问题;第二就是基础设施的提升与高速连接的普及,让人们可以实时获取计算机分析与处理的结果。可以说,正是大数据的出现与存在让人工智能在今天成为了具有现实意义的技术。而这也从侧面印证了国双为何能在人工智能领域拔得头筹的原因:作为国内首家赴美上市的大数据公司,正是基于十余年深厚的大数据技术积累,今天的国双才能在人工智能领域迅猛发展。
2019年5月20日,由科技日报社主办、中国科技网承办的“创新中国·2018年度评选”颁奖典礼上,发布了“民营科技企业创新500强”榜单,国双位列人工智能版块第二名。在一群耳熟能详的独角兽名单中,国双的名字显得有些陌生却又厚重:那层薄薄的名单背后,隐藏的是国双十余年来深厚的技术积累与沉淀。
打通感知与认知,让机器像人一样思考
人工智能的本质是让机器像人一样思考,甚至超过人类智能,而大数据基础只是让人工智能具备现实意义成为可能,但真正让机器像人一样具有理解、思维的能力仍然任重而道远。
“以Alpha Go为代表的深度学习,与人类智能比起来就有很强的局限性。”在祁国晟看来,这些局限性主要体现在3方面:一是无法真正从人类的角度理解世界;二是预测范畴无法超越历史训练数据集;三是不能创造新的知识。究其原因,无非是没有赋予机器认知能力。
类比人类信息处理的方式,人工智能其实可以分为两个层面的能力:一是感知层,即对外在信号的反应;二是认知层,也就是信息加工的过程。目前市场上大部分企业宣传的人工智能技术,譬如人脸识别、语音转写等都属于感知层面的人工智能,但对于绝大部分应用场景而言,仅仅拥有单纯的感知能力是不够的,必须要对信息进行进一步加工,判断和推理,这时就必须结合认知类人工智能技术。
“语言赋予了人类学习、理解的能力,知识是人类探索世界的积累和力量,因此自然语言处理技术、知识图谱可以赋予机器认知能力。”祁国晟表示,这也是为何国双近年来着力发展这两大技术的关键原因——只有打通感知与认知的人工智能才是真正具备社会意义和价值的人工智能。
首先是自然语言处理技术。在人工智能发展史中,有一个判断机器是否拥有智能的著名测试方法——图灵测试。简单来讲,就是将测试者与被测试者(一个人和一台机器)隔开,通过一些装置(如键盘)开启随意聊天模式,如果测试者无法判断被测试者是人还是机器,那就可以说这台机器通过了测试。可以想见,将人与机器区隔开的关键就是理解自然语言的能力,这也是为何自然语言处理技术会被誉为“人工智能皇冠上的明珠”。通过自然语言处理技术,机器可以解析不同层面的语义,更接近人的理解;同时也能生成有结构的文本,模仿人类写作的能力。
另一个关键技术就是知识图谱,即用于描述真实世界各种实体与概念的逻辑关系。众所周知,人类之所以区别于其他物种的关键之一就在于逻辑思维,而对机器而言,通过知识图谱就可以帮助机器像人一样思维、判断与推理。当构建出行业知识图谱后,只要输入这一行业的相关信息,机器就会自动与行业知识图谱进行关联,做出相应判断。
“知识图谱帮助我们加速了整个产业的智能升级,解决不同行业跟领域的实际问题。”国双CTO刘激扬介绍。
2018年10月,在首届“中国法研杯”司法人工智能挑战赛(CAIL 2018)颁奖现场,国双在罪名预测、法条推荐、刑期预测3项任务中,以2项单项第一、总分第一的成绩成为众人瞩目的焦点,其中,国双在司法领域搭建的知识图谱就起到了重要作用;2018年12月,在“AI Challenger 2018全球AI挑战赛”中,国双又凭借领先的自然语言处理技术,从全球超过10000支团队中脱颖而出,一举夺得“细粒度用户评论情感分析”赛道季军……在一项又一项人工智能领域顶级赛道上,国双用实力书写了一份又一份传奇。
不可或缺的人机交互时代
大规模、高质量的数据和行业专家的经验,是人工智能不可或缺的组成部分,同时也是国双多年来摸索出来的独特路径。
要用大数据和人工智能去解决行业问题,国双深知站在行业“门外”,单凭技术是无法完成的。不管是自然语言处理技术还是知识图谱,没有行业专家的参与很难成行。譬如自然语言处理领域,一个中文文本或一个汉字串可能有多个含义,中文文本解析尤为艰难,要让机器自动识别出符合行业知识的专有名词和概念目前还不可能实现。而在国双,就会运用专家建立行业专有词库提升准确性。
“也正因如此,一旦战略上决定进入某个行业,国双做的第一步工作就是与这个行业中最懂行、最有经验、最有能力的专家合作,甚至邀请大量行业专家到国双任职,与国双数据科学家、研发人员一起合作,迅速提升国双在这一行业领域的专业能力。要做到这点前期无疑需要大量的时间、人力、财力投入,其他企业极少会有这样的决心与专注,这也是我觉得国双非常了不起的地方。”刘激扬感叹。
如今的国双,无论在哪一个业务领域,你都能找到一批最富有行业知识和话语权的人:数字营销领域有营销咨询师、酒店管理专家、媒介专家,司法领域有资深法官、律师、检察官,工业互联网领域还有企业信息管理咨询师、石油勘探专家、能源管理专家……一言以蔽之,用最懂行的人与最领先的技术结合,做最专业的事。
To B软件企业,扬帆正当时
随着人工智能在全球范围内兴起,人们一方面对人工智能即将带来的美好生活充满向往,另一方面又对人类可能面临的失业、隐私泄露感到焦虑不安。其实,了解技术的本质后会发现,人工智能与其他技术工具并无不同。
科学可以探索未知,技术却必须结合实际。人工智能半个多世纪的跌宕沉浮正是由此而来。“再先进的技术,它的本质也是为人类服务,人工智能同样如此。”刘激扬介绍。
在他看来,目前市场上对人工智能的认识过于夸大,单纯的人工智能技术其实并没有人们想象中的强大,也没有一个通用的人工智能出现,而自然语言处理技术也仍是学界亟待解决的难题。不过,结合人类知识与经验的情况下,同样可以赋予机器学习与思考的能力。
“作为企业级软件技术提供方,我们必须清楚我们追求的技术到底是什么,不是最新、最顶尖的技术,而是真正实用,具备产业价值与社会价值的技术。国双的梦想‘用技术改变产业,促进社会发展’,多年来一以贯之,从未改变。它让我们随时随地都在思考如何用技术赋能产业,帮助她们提升效率、降低成本、增进收益。而在当下各行各业面临数字化转型的时代,大数据与人工智能就是我们实现梦想的最佳利器。”刘激扬说道。
“推动互联网、大数据、人工智能与实体经济深度融合”,也正是党的十九大对我国数字经济发展提出的新战略方向。
在国双十余年发展历程中,每一个关键技术与业务领域无不是基于国家战略、行业发展趋势顺势而为。无论是2015年成立的司法大数据还是2017年进军的工业互联网,都是结合时代与行业自身转型发展的需要借势而起。
政策利好、企业转型刚需、大众意识的觉醒……今天,产业互联网正迎来前所未有的新时代。而作为各行各业数字化转型的最佳助手, To B软件企业扬帆正当时。