新闻动态
NEWS
NLPCC认证:国双自然语言处理技术取得新突破
还在念念不忘“我命由我不由天”的小哪吒吗?留心一下周围,更多深藏不露的高手可能就在你身边——根据中国计算机学会(CCF)的最新消息,国双数据科学团队撰写的三篇自然语言处理论文被NLPCC2019学术大会录用。NLPCC堪称中文NLP的“奥斯卡”,快来了解一下吧!
什么是NLPCC?
NLPCC全称为CCF国际自然语言处理与中文计算会议(The CCF International Conference on Natural Language Processing and Chinese Computing),由中国计算机学会(CCF)中文信息技术(NLP)专委会主办。秉承国际化和一流化的严格标准,NLPCC已成为国内自然语言处理(NLP)领域内最权威的会议,堪称中文NLP的“奥斯卡”。
NLPCC 会议内容主要围绕自然语言处理(NLP)和中文计算(CC)两方面来进行,包括多个技术评测、学科前沿讲习班(ADL)、主会等活动。为了保证论文质量,NLPCC的程序委员会借鉴ACL(Association for Computational Linguistics),即国际计算语言学和NLP研究领域最具影响力的学术组织模式,严格按照录用论文的标准决定录用哪些稿件,所有文章均会严格筛选。
NLPCC会议主办者CCF中文信息技术专委会主席周明博士介绍,NLPCC会议的论文录取率和ACL相当。
打破人工智能认知层,你还需要自然语言处理技术!
近年来,随着云计算、大数据、算法模型(以深度学习为代表)以及落地场景四大要素的齐备,人工智能进入了一个高速发展的时期,主要发展方向体现在两方面:感知智能与认知智能。
目前市场上大部分宣传的人工智能技术,譬如人脸识别、语音转写等都属于感知层面的人工智能,而更深层次的认知智能,由于其背后的技术难度一直成为业界亟待破解的难题。
比尔·盖茨曾说,“语言理解是人工智能皇冠上的明珠”。作为将人与机器区隔开的关键能力:自然语言处理技术,便处于认知智能中最核心的地位。通过自然语言处理技术,机器可以解析不同层面的语义,更接近人的理解;同时也能生成有结构的文本,模仿人类写作的能力。
想了解自然语言处理技术,快来关注国双吧!
在本次国双被录用的三篇论文中,就分别展现了国双在自然语言处理领域的突破性成绩。
《Multi-Task Multi-Head Attention Memory Network for Fine-Grained Sentiment Analysis》一文,抓住自然语言处理领域中情感分析的研究热点,提出利用多头注意力模型结构,以及两个公开数据集,训练多类别细粒度情感分析模型达成优化,更精细地给出情感属性结果。运用这一模型和方法,人们可以从某一场景的一句话中,精细提炼出作者的情感偏好,从而更准确的反映对产品、服务等的满意程度。值得一提的是,基于细粒度用户评论情感分析能力,国双还获得了2018全球AI挑战赛季军。
《A Hierarchical Model with Recurrent Convolutional Neural Networks for Sequential Sentence Classification》一文则是结合司法业务中司法文书段落解析的背景,提出了多层次模型结构,利用3个公开的学术数据集,建立自有模型,论证出如何更好地解决段落解析。众所周知,司法文书中的段落解析作为实现范围定位的方法在整个解析流程中占有重要地位,是流程下游其他内容解析的基础。一旦分段出错,最终生成的判决结果准确率无法保证。在2018首届“中国法研杯”司法人工智能挑战赛中,国双就利用此项核心技术夺得了冠军。
《A Relation Proposal Network for End-to-End Information Extraction》主要提及知识图谱,知识图谱需要投入大量的人工成本进行构建,机器辅助的三元组抽取对于提升知识图谱的构建效率有很大的帮助。结合2019语言与智能技术竞赛通用领域文本信息抽取赛道的方案,本文提出了一种基于关系候选区的端到端的三元组抽取模型,既提升了三元组抽取的效率、也提升了三元组抽取结果的准确率。建立这样的三元组抽取辅助系统可以提高在通用领域、司法领域、油气等细分领域的知识构建效率。
本届NLPCC2019学术大会将于10月9—14日在敦煌召开,国双将在会上分享自然语言处理领域取得的成果。要让人工智能真正深入行业解决实际问题,自然语言处理技术必不可少。作为助力企业数字化转型的最佳助手,国双也将不断深耕前沿科技,用最领先的技术为企业服务!