11月@@28-29日@@,由中国社会科学院信息化研究中心和北京国脉@@互联@@信息顾问有限公司联合举办的@@@@“2018智慧中国@@年@@会@@”在北京隆重召开@@,以@@“数据@@赋能@@ 智慧中国@@”为主题@@,共有来自@@全国部委@@、省@@、市@@、区县电子政务@@@@、智慧城市@@@@、大数据@@主管领导@@、行业专家@@、企业代表@@、主流媒体千余人参会@@。

  本文系北京中润普达公司@@@@CEO杜小军@@先生于@@11月@@28日@@下午在@@“2018智慧中国@@年@@会@@”分论坛@@三@@@@--“人工智能@@@@赋能智慧政府研讨会@@”上的@@演讲@@,内容通过现场速记整理@@,未经本人审核@@。

image.png

  【北京中润普达公司@@CEO 杜小军@@】

  我是一@@个人工智能@@@@领域的@@重建者@@,今天想跟大家分享@@我们团队在@@人工智能@@@@领域做的@@一@@些事情@@。

  目前大家对大数据@@@@、人工智能@@@@、包括区块链都非常关注@@@@,我们团队在@@2014年@@初创办时就是围绕中文@@语义@@识别@@@@。我们的@@子公司大家都有所了解@@:东湖大数据@@交易中心@@、江苏省@@大数据@@工程实验室@@、华东江苏大数据@@交易中心@@、钱塘工业@@大数据@@交易中心@@,以@@及正在筹建的@@国家气象大数据@@服务平台@@等@@。中文@@语义@@识别@@是我们公司的@@一@@项技术@@,如果说大数据@@是生产资料@@,那么人工智能@@@@就是生产力@@,区块链就理解@@为生产关系@@。所以@@下一@@个十年@@@@、二@@十年@@我们回过头来看今天谈的@@大数据@@@@,其中很多事情就迎刃而解@@。因此@@,我是从@@生产力的@@角度看中文@@语义@@识别@@怎么推动人工智能@@@@的@@利用和发展@@。

  一@@、人工智能@@@@中文@@语义@@识别@@@@

  (一@@)人工智能@@@@产业发展三@@大阶段@@

  计算智能@@阶段@@(50年@@代@@-90年@@代@@):代表是@@计算机@@,机器基于@@计算智能@@有很强的@@数据@@处理和分析@@能力@@。从@@全球来看@@,这个阶段对数据@@的@@质量@@,尤其是数据@@的@@颗粒度@@、算法要求极高@@,这是目前人工智能@@@@发展在这个阶段可以@@达到一@@定的@@水平@@,中国和美国在人工智能@@@@领域竞争非常激烈@@。

  感知智能@@阶段@@(90年@@代@@末@@-2010年@@):代表是@@深蓝系统@@、智能@@手机@@,在这个阶段人工智能@@@@机器能说会写@@。感知智能@@就是现在说的@@互联网@@@@,随着芯片成本的@@进一@@步下降@@,单个芯片价格低至@@几分钱@@,数据@@的@@传感@@、采集@@、爆发形成超出人类想象的@@数据@@链@@。人工智能@@@@从@@语音阶段逐步发展到机器发育阶段@@,特点包括语音@@、图像@@、视频解析@@,这些也越来越精准@@,有些能达到@@80%的@@精准@@。目前中美开始在这个领域@@全面竞争@@,中国在这个领域@@有些超过美国@@。

  认知智能@@@@阶段@@(2010年@@末到现在@@):代表是@@Alpha Go,具有自@@主学习能力@@。从@@去年@@开始@@,Alpha Go在中国力度加大@@,它是人工智能@@@@三@@大顶层核心技术之一@@@@,让机器具备人的@@思考能力@@。我们把前两者称为弱的@@能力@@,而强能力都来至@@于对语言的@@真正理解@@@@,赋予机器具有思考的@@能力@@。

  (二@@)认知智能@@@@是未来人工智能@@@@发展的@@核心焦点@@

  国务院@@《新一@@代人工智能@@@@发展规划@@》明确表示未来@@5-10年@@在人工智能@@@@领域需要建立数据@@驱动@@、以@@自@@然语言理解@@为核心目标的@@认知计算模型@@,形成从@@大数据@@到知识结构化@@、从@@知识结构化转换成具有决策能力的@@新一@@代技术革命@@。这在整个新一@@代人工智能@@@@规划的@@八大基础技术里非常重要的@@一@@项@@,多部委已经把自@@然语言@@(NLP)为核心的@@认知计算技术作为人工智能@@@@自@@制核心技术开展技术突破@@,并且逐步推动产业化@@。从@@2017年@@新兴技术曲线来看@@,基于@@认知计算和智能@@机器人里最核心的@@还是认知计算@@,就是以@@自@@然语言理解@@为基础@@。

  (三@@)认知智能@@@@(中文@@语义@@识别@@)迎来巨大产业发展契机@@

  预计到@@2025年@@底@@,43%的@@文字处理工作将由人工智能@@@@系统自@@动完成@@。中国在图像@@识别@@@@、人工智能@@@@、单点技术方面已经遥遥领先于全球@@,未来七@@年@@@@,认知交互@@的@@全球市@@场@@,每年@@增长率将达到@@34.9%。据估算@@,2024年@@的@@全球市@@场规模保守估计将达到@@720亿元@@美元@@。国内资本对于自@@然语言处理的@@投入相当巨大@@,至@@2017年@@底@@,已披露融资总额累计超@@54亿元@@。随着技术带来的@@产业化的@@突破@@,市@@场非常巨大@@。

  (四@@)人工智能@@@@-认知智能@@@@的@@应用@@场景@@@@

  认知智能@@@@可以@@分析@@网页@@、文件@@、邮件@@、音频@@、论坛@@、社交媒体中的@@大量数据@@@@,应用@@领域@@广泛@@,既可以@@直接应用@@于医疗@@@@、教育@@、金融@@、工业@@、影视@@、农业等多行业@@,也可以@@通过技术接口应用@@于所有智能@@语音交互@@场景@@,如智能@@家居@@、车载语音@@、可穿戴设备@@@@、VR、机器人等@@。数字政府@@方面@@,国内有些城市@@已开始试点@@,未来人与政府打交道只需要与机器见面@@,机器就像城市@@大脑@@@@,帮你解决一@@切人能解决的@@问题@@,当然这是一@@个远景@@。但现在已经在逐步实现@@,包括一@@些城市@@的@@标准化的@@东西@@,这个标准化不需要人来思考@@,机器去学习就行@@,人和机器的@@交互@@未来就是人和政府的@@大脑之间的@@交互@@@@,所以@@智能@@语义识别被看作未来人工智能@@@@技术中最值得期待的@@应用@@场景@@@@。

  二@@、技术支点和创新点@@

  (一@@)20多项独创发明专利@@:基于@@中文@@分词@@矩阵技术的@@类脑智能@@系统和装置@@

  2018年@@6月@@,中润普达正式申报中文@@语义@@类脑辅助系统@@@@@@(魔系@@AI)。首次@@提出把人脑当作一@@个复杂的@@信息处理系统来考虑@@,从@@整体和动态的@@角度@@,架构一@@个中文@@分词@@@@(包括意群@@@@)认知矩阵及模型@@,在此基础上让各场景的@@汉语分词@@@@(包括意群@@@@)认知矩阵及模型@@之间形成协同竞争关系和类脑信息加工模式@@,完成类脑系统计算@@,并解释语言@@、分词@@、意群@@以@@及句子等生成的@@神经机制和原理@@。举例@@:现在机场的@@机器人能够背诵唐诗@@、唱歌@@,还包括现在广泛应用@@的@@智能@@音响@@、人工智能@@@@设备@@@@,这些都叫做弱的@@人工智能@@@@@@。我们需要具备学习力的@@机器人@@,能够和人沟通@@,目前整个机器人市@@场在往这个方面转型@@,一@@个聪明的@@算法@@、一@@个崭新的@@系统@@、一@@个中文@@的@@大脑@@、一@@个颠覆性应用@@正在逐步实现创新@@。

  (二@@)中文@@语义@@类脑辅助系统@@@@技术能力理论支点@@

  “不要去设计机器人@@,而是培养机器人@@。”让机器像人类一@@样思考@@,必须具备像人一@@样的@@理解@@@@、推理@@、可视化@@、交互@@、学习等几个基础要素@@,每一@@个要素里面有庞大的@@基于@@类脑的@@相关功能@@,这个功能有的@@超出目前工程师的@@技术@@,需要新的@@办法来解决@@。

  (三@@)中文@@语义@@识别@@技术使命@@:让机器像人类一@@样思考@@

  中润普达自@@主研发的@@中文@@大数据@@的@@核心技术@@--中文@@认知矩阵和动态平衡模型计算技术@@,是领先的@@创新的@@中文@@大数据@@关键计算技术@@。利用独立开发的@@@@“人工神经元网络@@@@”数学算法模型@@,将海量的@@非结构化和结构化的@@数据@@放到模拟器中去@@,让魔系@@@@ AI主脑进行学习@@。随着时间的@@推移@@,产生突变@@,培养它让其成为具有自@@主学习意识的@@机器大脑@@,可应用@@到所有人工智能@@@@生态链条中@@。举例@@:百度搜索@@会留痕@@,下次@@登录会根据访问行为推荐搜索@@内容@@,坦率讲这不是机器学习@@,这是服务器日@@志的@@自@@主记忆@@、主动推送@@。国内在自@@主学习机器人方面还有很长的@@路要走@@,在这个产业@@,缺乏大量的@@创新@@,需要太多的@@专家@@、投资和创新的@@失败@@。我们团队是从@@另外一@@个角度在一@@点点的@@创新里面实现了@@3-6岁小孩的@@水平@@,机器人通过数据@@的@@不断喂养@@,能够实现与人的@@基本交流@@,比如你讲一@@个笑话@@,它能根据上下文或语义理解@@也讲一@@个笑话@@,还有在医疗@@方面也有一@@些类脑的@@案例@@。路途虽遥远@@,但这也是产业化的@@必经之路@@。

  (四@@)5个人工智能@@@@语义识别技术应用@@产品@@(试商用@@)

  目前中润普达推出了@@5个人工智能@@@@语义识别技术应用@@产品@@:

  魔系@@AI - 海量文本处理智能@@平台@@@@:通过计算机自@@动对@@(中文@@)文本信息进行快速识别@@、检索@@、分类和精确定位@@,并能在不同语境下进行语义分析@@@@;是一@@个崭新的@@更高级的@@计算机自@@动识别与检索@@中文@@文本处理系统@@。

  裂云@@AI - 精准营销@@智能@@平台@@@@:通过接入各大运营商和各大数据@@源机构的@@大数据@@平台@@@@,以@@自@@建分布式@@DMP平台@@为基础@@,提供精准人群标签@@和用户画像@@,应用@@于征信@@、精准营销@@、金融@@、保险@@、快销@@、汽车等等行业@@,为给各类大数据@@应用@@服务提供创新产品@@。

  冲霄@@AI - 政务@@智能@@决策@@平台@@@@:国内首个基于@@@@AI的@@新一@@代政务@@大数据@@@@可视分析@@平台@@@@,适用于工商@@、工会@@、税务@@、环保@@、安监@@、质检@@、旅游@@、城管@@、文明等各种场景@@,为政务@@或商业决策提供重要参考@@,提升组织的@@决策精准性和前瞻性@@。

  神通@@AI - 商业智能@@决策@@平台@@@@:基于@@AI的@@商业大数据@@可视分析@@工具平台@@@@。能够最大限度地利用数据@@获得最大的@@价值@@,实现商业的@@智能@@决策@@@@,提高数据@@管理和数据@@资产的@@变现能力@@。

  傲天@@AI - 写作和传播智能@@机器@@:国内首家基于@@@@AI的@@文章全生命周期@@(从@@创作到传播@@)自@@运行机器人@@。它通过对海量文章的@@深度学习@@,总结了万余种不同题材@@、体裁和场景下的@@文章结构@@,从@@而让机器具备自@@动写作能力@@。

  三@@、技术实践和应用@@路径@@

  (一@@)魔系@@AI-中文@@语义@@类脑辅助系统@@@@

  魔系@@AI为各类机器人配备中文@@语义@@大脑@@,使其能够听懂和了解用户的@@基本意思和声音@@,更好地与人类交互@@@@,完成多种匹配的@@动作及相关的@@指令@@。这个系统我们走的@@是不同的@@技术路径@@,帮助我们少走一@@些弯路@@。

  (二@@)我们做的@@是让机器与人沟通交流的@@人工智能@@@@中文@@语义@@类脑辅助系统@@@@@@

  我们专注@@于中文@@@@,中国人对中文@@的@@语义理解@@远比外国人强@@,在这个领域@@,王选院士发明的@@@@“汉字激光照排系统@@”,全球占有@@99.7%的@@规模@@,到现在还没有哪个互联网@@技术或其他技术达到这样的@@水平@@,激光照排技术的@@核心就是对中文@@的@@解读@@。

  在具体的@@场景目标任务条件下@@,通过添加分词@@@@(意群@@),并植入这个类脑计算系统@@,无需写代码@@,系统可以@@帮助网络@@、机器和设备@@等实现让机器和设备@@具备自@@我学习@@、发现@@、理解@@、推理@@等各类能力@@,并形成自@@我知识体系@@;它让机器能像人一@@样@@,实现智能@@对话@@、智能@@客服@@、智能@@聊天@@、句子生成@@、知识发现@@@@、知识生成@@、模式识别@@、智能@@分析@@等@@,并能够按照要求辅助处理专属应用@@场景@@的@@知识和业务@@。

  (三@@)快速搭建中文@@语义@@类脑@@(魔系@@AI)

  魔系@@AI具体方法是@@:按照魔系@@@@AI的@@操作程序@@,只需添加分词@@@@、意群@@和句子@@,导入模板@@,即可应用@@到各类场景之中@@;为每一@@个机器@@、设备@@、终端@@都能够装上专属场景的@@@@、有知识@@、会聊天@@、能决策@@、自@@学习@@,并且有性格@@、有情感的@@中文@@语言交流@@、沟通的@@大脑系统@@;结合大数据@@@@,魔系@@AI搭建了有效的@@深度学习的@@算法@@,在数据@@足够的@@情况下@@, 魔系@@AI的@@“神经元网络@@”系统将会以@@阶梯式的@@速度进行深度自@@我学习和调整@@。

  (四@@)未来魔系@@@@AI 和行业深度结合@@

  与云@@、端@@、芯形成产品生态@@:芯片端@@提供一@@整套的@@软硬件一@@体的@@落地方案@@,终端@@领域提供人工智能@@@@交互@@软件@@通过云端@@数据@@整合@@、分析@@、运算从@@而提供更精准的@@服务@@。

  IOT时代无限的@@终端@@入口@@:开放的@@终端@@入口快速积累用户信息@@,持续向云端@@进行数据@@传递@@。

  应用@@领域@@:强大的@@技术体系从@@语音识别@@@@、语义理解@@到语音合成集云端@@服务为一@@体@@,首个独创的@@工程架构体系实现行业最先的@@效果和稳定性@@。

  (五@@)魔系@@AI试商用@@阶段进展@@

  目前已经在深圳某法院@@开展人工智能@@@@法院建设试点工作@@,和部分重点医院合作开展健康医疗@@大数据@@的@@@@AI产品研发@@;部分城市@@开展@@“城市@@大脑@@”技术应用@@实践@@(湖北省@@十堰市@@@@、江西上饶市@@和湖北荆州市@@@@)。

  魔系@@AI智能@@“吾真@@”问诊系统@@ -- 湖北十堰三@@甲医院太和医院@@

  应用@@于诊疗的@@全过程@@,实现诊前智能@@分诊@@、挂号@@;诊中智能@@导诊@@、语音电子病历@@;诊后慢性病康复辅助等@@,建立医疗@@各分支领域智能@@知识库@@,打造快速精准的@@智能@@医疗@@体系@@。

  魔系@@AI法律助手@@ -- 深圳某法院@@

  通过分词@@矩阵技术@@,构建法律知识逻辑系统@@,精准地找到与案件相关各种信息和文档@@,降低人力搜索@@卷宗的@@时间成本@@;通过法律机器人@@,快速解答法律方面的@@问询@@,节省@@咨询@@的@@人力成本@@。

  魔系@@AI语音交互@@系统@@ -- 东风汽车公司@@

  结合已有的@@车载系统@@,用语音搜索@@行程路线@@、操控车内设备@@@@、查询目的@@地天气状况@@,在意外发生时报修拖车@@、保险@@理赔等@@,让魔系@@@@AI帮车主解决行车中遇到的@@问题@@。

  (六@@)魔系@@AI平台@@的@@应用@@效果目标@@:让人回归人的@@价值@@

  为什么要发展人工智能@@@@@@,人工智能@@@@能够提升生产力@@。当人每周只需要工作@@2天的@@时候@@,这就是生产力的@@体现@@。智能@@问答可以@@解决@@85%以@@上@@常见问题@@,在问答匹配@@、理解@@语义上准确率@@高达@@97%;通过魔系@@进行文档处理@@,较人工相比处理效果提升@@59倍@@,准确率@@95%以@@上@@;在某些领域@@,可以@@替代@@60%以@@上@@的@@人工@@,极大降低了企业经营成本和提升效率@@。这是让人回归人的@@价值@@最实在的@@体现@@。

  (七@@)应用@@场景@@:为每一@@台机器人赋予一@@个类脑辅助系统@@@@

  为每一@@个机器@@、设备@@和终端@@都装上一@@个魔系@@@@AI专属场景的@@中文@@交流@@、沟通的@@类脑辅助系统@@@@。基于@@基础的@@数据@@元@@,交易中心本来就是数据@@流通的@@中心@@,期望各类数据@@能培养机器人@@,包括语音识别@@@@、图像@@识别@@、标注@@@@、分析@@、挖掘等海量的@@结构和非结构化数据@@需要在一@@定场合适用不同的@@机器人@@。当然这些不是光靠中文@@语言技术能实现的@@@@,还涉及到图像@@识别@@@@、语音识别@@、机器学习等基础技术@@。解决方案方面包括各行业的@@机器人方案@@,可以@@广泛应用@@到数字政府@@@@、医疗@@、智能@@办公等领域@@。

  四@@、小结@@

  今天介绍的@@是我们团队做的@@一@@些研发@@,并不能代表这个产业的@@最高水平@@,但是在这个方向上我们会持续不断地投入@@,也希望得到各位的@@指导和关注@@@@,谢谢大家@@!

  附@@:国脉@@,是领先的@@大数据@@治理@@和数字政府@@专业提供商@@。创新提出@@“软件@@+咨询@@+平台@@+数据@@+创新业务@@”五@@位一@@体服务模型@@,拥有数据@@基因@@和水巢@@DIPS两大系列几十项软件@@产品@@,长期为中国智慧城市@@@@@@、智慧政府和智慧企业提供专业咨询@@规划和数据@@服务@@,广泛服务于信息中心@@、大数据@@局@@、行政服务中心等政府客户@@、中央企业和金融@@机构@@。自@@2004年@@成立以@@来@@,已在全国七@@大区域设立@@20余家@@分支机构@@、5大技术研发基地@@,服务客户@@2000余家@@,执行项目@@5000余个@@,连续多年@@开展中国政府网站@@@@、智慧城市@@@@、互联网@@+政务@@、营商环境@@等公益评估评选活动@@。被业界誉为中国信息化民间智库知名品牌@@、电子政务@@优选咨询@@机构@@,国内首倡智慧政府理念@@,首创智慧城市@@@@@@、数据@@治理@@、互联网@@+政务@@评价体系@@,首推数据@@资产普查@@、全口径数据@@资源目录@@、数据@@元标准化@@、数源确认与供需对接@@、最多跑一@@次@@@@事项梳理@@、营商通等产品@@,信息资源编目@@、公共数据@@普查等业务全国占有率和影响力名居榜首@@。

  注@@:获取更多@@会议信息及嘉宾演讲资料@@,欢迎登录@@“2018智慧中国@@年@@会@@官网@@”。

年@@会官网@@.png

  现场照片直播分享@@@@:

现场直播@@.png

责任编辑@@:hejieling