轮值主编 | 智勇 责编| 青羊
第 7412篇深度好文:2219字 | 6 分钟阅读
AI
【资料图】
笔记君说:
今日科大讯飞召开 " 讯飞星火认知大模型 " 成果发布会。
科大讯飞董事长刘庆峰、科大讯飞研究院院长刘聪,从文本生成、语言理解、知识问答、数学能力、逻辑推理、代码生成、多模态输入及生成7 个维度演示了大模型的通用能力,以及认知大模型与讯飞现有产品结合的商业应用成果。
国内认知大模型的最高水平是什么样?一起来看看。
一、认知大模型的七个能力维度
自从去年 11 月 OpenAI 推出 ChatGPT 以来,认知大模型技术在全球掀起了人工智能的全新浪潮,认知大模型的出现不亚于 PC 或者互联网的诞生。
通过统一的大模型学习后,系统具备了像人类一样触类旁通的能力,可以在跨领域形成良好表现,认知大模型已经实实在在开启了通用人工智能的曙光,星星之火开始出现。
目前,国内通用大模型的水平如何?
我们不得而知,但是讯飞的认知大模型已经具备了 7 大通用能力,在教育、办公、汽车、数字员工等多个领域都能落地应用,并且在文本生成、知识问答、数学能力三大能力上已超越 ChatGPT。
1. 长文本生成能力
刘聪现场用星火认知大模型生成了一段欢迎词,展示了大模型的文本生成能力。
为了测试不同文本类型的生成能力,刘聪还让星火认知大模型生成了邮件、故事、中英品宣文案等文字内容。
认知大模型,生成了一段孙悟空和奥特曼的故事,还使用语音朗读了这段现场生成的小故事。
所有内容都是大模型随机生成的,即使是同样的关键词和描述,每次生成的内容也是不同的。星火认知大模型在中文文本生成方面的能力已经超越了 ChatGPT,英文方面达到了 4.29 分,而 ChatGPT 是 4.48 分。
2. 语言理解能力
科大讯飞通过两个例子,演示了大模型在语法检查和语义理解上的成果。
在输入一段存在单词拼写错误、单复数错误、时态错误等问题的英文段落后,星火认知大模型迅速生成了一段纠正所有错误的文字。
展示语义理解能力时,刘庆峰以 " 俗话说男子汉大丈夫宁死不屈,但俗话又说男子汉大丈夫能屈能伸 " 为例,测试了大模型是否能准确理解这两句话背后的含义。
此外,对同一句话在不同语境中的不同理解,大模型也给出了准确的回答。
3. 知识问答
大模型的知识问答能力包括生活常识类、科学知识、工作技巧、医学知识等。比如,在医疗领域,大模型将不仅成为医生的助手,还会成为每个人的健康助手。
后续更多科普知识也会被融入到大模型中。在中国科学院支持下,大模型将持续不断学习更多科学资料,不断提升科学问答能力。
4. 逻辑推理
为了测试星火大模型是否真的可以理解人类提问,刘庆峰通过常识理解和故事编辑两种方式进行了演示。
现场问大模型 " 孔子在 2008 年奥运会上发表了什么讲话?" 大模型基于历史和常识判断出孔子不可能出现在奥运会现场。让大模型以此为主题生成一个故事时,它则从创作维度根据给出的提示编辑生成了一个小故事。
5. 数学能力
数学能力一定意义上代表了认知大模型通用能力的认知水平,星火认知大模型在数学能力方面遥遥领先。
从基础计算到三角形求度数再到应用题,星火认知大模型都在现场演示中给出了准确答案。
6. 代码能力
发布会现场星火认知大模型进行了一小段 " 找出 1 到 100 之间的质数并输出结果 " 代码生成的演示。
代码生成能力主要针对工业互联网和企业内部使用,星火认知大模型仍在不断训练中,未来两到三个月代码运行能力将有很大提升。
7. 多模态输入和表达能力
除了前文已经提到过的语音识别和朗读功能,发布会中还展示了大模型的图文输入和理解能力,不仅可以把英文菜单翻译为中文,还可以对菜单里的菜名进行解释,描述菜品的味道。
这一功能不仅可以应用在简单的图文翻译中,也可以成为旅行助手,在提供翻译功能的同时,介绍不同名胜古迹背后的含义和历史故事。
更值得一提的是,星火认知大模型还可以根据文字直接生成视频内容,无论是声音、虚拟人形象、唇型、手势还是视频背景都由大模型实时生成。
后续,星火认知大模型完善的方向如下:进一步提升大模型的开放式问答和多轮对话能力;实现代码生成能力升级,并将多模态交互能力开放给客户;全面实现通用模型对标 ChatGPT 等。
二、四个领域,取得落地成果
在教育领域,一直以来,作文提升都是教学中的一大难点,以批改为例,找出病句、好句、给出评语,一篇文章最少需要老师用 30 分钟才能完成。
而星火大模型的语言能力和学习机结合,可以对作文快速进行深度理解,自动生成评语和范文。
在办公领域,大模型升级产品,帮助智慧办公迈入了全新阶段,可以满足语音转写、会议记录等多语种翻译等多种办公需求,助力职场人提升工作效率。
在汽车领域和数字人领域,大模型和产品及业务进行全面结合,比如虚拟人智能交互机现已有 1000 多个虚拟形象资产、300 多个专业声音、30 多万用户自定义音库,可以提供更加自动化、个性化的数字员工服务,实现 24 小时不打烊营业。
三、中外大模型能力差距争议
追赶 OpenAI 首先需要一套科学系统的评测体系。
刘庆峰认为,认知大模型刚刚起步,还在快速成长和迭代过程中。
让这次智慧涌现的认知智能解决社会刚需,需要一套脚踏实地的科学系统的评测体系。
在认知大模型还在快速迭代中,如果只是找单点例子来证明某个系统的强弱,是没有意义的。
* 文章为作者独立观点,不代表笔记侠立场。
左战略、右组织,扫码成为笔记侠的朋友
领取 10 万字 + 的战略、组织干货合集,迭代你的赚钱思路
分享、点赞、在看,3 连 3 连内容来源:本文来自讯飞星火认知大模型成果发布会。轮值主编|智勇责编|青羊第7412篇深度好文:2219字|6分钟
新产业(300832)05月06日在投资者关系平台上答复了投资者关心的问题。投资者:公司认为自身的资金收益率处于
中小板餐饮上市公司股票有这几家!,截至5月5日,中小板餐饮上市公司有三特索道、ST獐子岛、云南旅游、全聚
科泰电源(行情300153,诊股)5月6日在互动平台回答投资者提问时表示,公司可为数据中心机房提供备用电源等电
感悟长江文化,领略长江之美,有了国家级新路线。文化和旅游部近日推出10条长江主题国家级旅游线路,无锡共
银行业是现代经济的核心与血脉,也被视为经济运行的“晴雨表”。今年以来,美国经济的这个“晴雨表”正...
扬子晚报网5月6日讯(记者任国勇通讯员鼓公宣江长志)近日,一名外地游客来南京游玩不慎将装有贵重物品的背
今年“五一”期间的旅游“成绩单”超市场预期,为了“抢游客”,各地文旅局局长也“铆足了劲”,纷纷掏...
为进一步加强农村食品安全监管工作,严厉打击农村经营假冒伪劣食品,规范农村食品市场秩序,近日,甘肃省漳
1、陈绮贞2、陈绮贞(Cheer),1975年6月6日出生于台湾省台北市,中国台湾民谣女歌手、作曲人、作词人、演
当地时间5月5日,俄罗斯瓦格纳雇佣兵集团创始人普里戈津表示,由于缺乏弹药,瓦格纳部队将于5月10日离开巴
5月4日,雨后的遵化市古长城附近云雾涌动,远山、长城若隐若现,美如仙境。
文明有我·凡人善举“感谢贵局培养出的好警察感谢他们爱民为民的情怀和积极担当的作风……”近日一封来...
截至2023年5月5日收盘,云鼎科技(000409)报收于8 44元,下跌2 54%,换手率4 16%,成交量17 62万手,成交额1 48亿元。
1、米虾网络有不少这方面的广告经验文章。2、你愿意就搜搜看吧。本文分享完毕,希望对大家有所帮助。
五一假期最后一天,大部分游客已经踏上返程。今年五一,不论是出游人数还是旅游收入,均已超过2019年。经文
2023年吉林高级经济师考试报名时间:4月28日-5月11日由经济师考试栏目提供,查找更多考试报名资讯、准考证打
新华社西宁5月5日电(记者央秀达珍)5月5日是世界肺动脉高压日。
人间四月天,本应是“春风花草香”,不过今年很多人的春天记忆却是“惊风击面黄沙走”。与此轮沙尘天气...
1、一、公共卫生间设计规范之图标公共卫生间设计应该遵循男左女右的常规规则,其图标的设计应该简单明了辨
湖人罚球优势没了!詹皇屡次不满判罚防守愣神送穆迪暴扣,湖人,勒布朗詹姆斯,勇士,安东尼·戴维斯,穆迪
富瑞上调欧舒丹(00973)2023-25财年各年净利润预测12% 2% 1%。
不出所料,那不勒斯顺利夺得了本赛季意甲冠军。在尤文图斯、米兰双雄以及拉齐奥等队的反复追赶下,那不勒斯
熵基科技(301330)05月05日在投资者关系平台上答复了投资者关心的问题。
智通财经APP获悉天韵国际控股06836大涨逾13高见25港元创上市以来新高截至发稿涨1091报244港元成交额25819万
X 关闭
X 关闭