热点在线丨这家大模型豪言半年内超越ChatGPT(内附测评)
作者|于惠如 编辑|罗丽娟
(资料图片仅供参考)
“认知大模型成为通用人工智能的曙光,科大讯飞有信心实现‘智能涌现’。”
5月6日,科大讯飞星火认知大模型揭开神秘面纱。发布会上,科大讯飞董事长刘庆峰、科大讯飞研究院院长刘聪在现场实测了讯飞星火在七大维度上的核心能力,包括多风格多任务长文本生成、语言理解、泛领域开放式知识问答、情境式思维链逻辑推理、多题型可解析数学、多功能多语言代码,以及多模态输入和表达等。
讯飞星火认知大模型发布的同时,科大讯飞也发布了基于该大模型的教育、办公、汽车和数字员工等多个领域相关产品。
星火认知大模型始于2022年12月。彼时,科大讯飞启动“1+N”大模型技术攻关,其中,“1”代表通用认知智能大模型算法研发及高效训练方案底座平台,“N”代表大模型在教育、办公、汽车、人机交互等各个领域的落地。
“当前,在文本生成、知识问答、数学能力三大能力上,讯飞星火认知大模型已超ChatGPT。”刘庆峰在发布会上表示。
与此同时,刘庆峰还给出了讯飞星火的迭代时间表及每阶段目标:第一阶段,在6月9日,突破开放性问答,如实时问答;多轮对话能力再次升级;数学能力再上台阶。第二阶段,在8月15日,突破代码能力;多模态交互能力正式开放给客户。第三阶段:10月24日,在通用大模型领域对标ChatGPT,其中中文能力超越后者,英文能力与后者相当。
此外,据刘庆峰透露,科大讯飞还将在今年推出医疗行业大模型。
发布会现场,刘庆峰用“最强”、“已超ChatGPT”、“遥遥领先”等词形容讯飞星火认知大模型的部分能力,但他同时也承认讯飞星火仍然存在一些问题。比如:对新知识难以及时更新;事实类问答容易出现“张冠李戴”;史实、传统典籍等容易“编造情节”等。
目前,星火认知大模型已对外开放测试。
现场实测七大核心能力
与百度文心一言、阿里通议千问不同,讯飞星火没有在发布会上使用提前录好的demo版本,而是在现场实测了其七大核心能力。
从现场演示效果来看,星火认知大模型基本能够流畅完成交付的各项任务。另外,讯飞星火体现了科大讯飞的一贯强项——语音能力,它可以通过语音转文字进行问答,这也是其优势所在。
演示中,刘聪让星火认知大模型写邮件、做方案、写新闻通稿、生成英文宣传文案等文本生成功能,讯飞星火均流畅地完成了任务。
现场演示的讯飞星火的语言理解能力也在线,它理解了特定的句子和场景含义,随着问题的变化,也调整了自己的答案
在数学能力中,除了常规计算、几何、情景应用等,讯飞星火解答了复杂的计算题答案。在刘庆峰看来,数理能力一定程度代表了一个大模型的聪明程度。“讯飞星火大模型不仅在国内系统中遥遥领先,也超过了ChatGPT。”
此外,刘聪还展示了大模型面向泛领域开放式知识问答能力、逻辑推理能力与代码能力。在多模态能力方面,星火大模型能够根据关键词句生成语音、图片、视频等素材,并可生成虚拟人进行视频展示。
不过,据官方介绍,讯飞星火的多模态能力目前还在测试中,最迟8月会提供给VIP客户使用。
打通“大模型+产品”闭环生态
讯飞星火认知大模型发布的当天,科大讯飞还同时发布了基于该大模型的教育、办公、汽车和数字员工等多个领域相关产品。
以汽车为例,讯飞火星认知大模型与智慧座舱的结合,可以实现车内跨业务、跨场景人车自由交流。基于大模型的智能座舱将更自由、拟人化、更懂汽车、更开放。
在学习机中,新增talktalk功能,实现中英文对话,存量学习机可更新迭代。办公本和录音笔中,新增语篇规整、要点总结、一键成稿,存量产品也可更新使用。
基于自然语言生成业务流程和RPA,在“大模型+数字员工”应用场景,可以帮助企业员工完成大量重复性工作。
现场以公司招聘事项为例,输入指令后,系统即可自动按照事先设计的RPA脚本,操作计算机中的相应软件,实现业务流程的自动化操作并输出结果,并进行数据分析。
刘庆峰透露,上述领域外,讯飞星火认知大模型还将赋能包括医疗、城市、政法、工业等在内的更多行业,满足更多专业领域的需求,向更广阔的产业领域延伸。
据了解,首批来自36个行业的3000余家企业开发者将接入星火大模型。
测试体验
星火大模型“成色”究竟如何?全天候科技亲测了多个场景下的问题,不妨一起来看一看它回答的如何。
我们先让星火大模型介绍了自己和竞品。
很明显,简单介绍没有问题,但当主语更复杂,需要理解时,它的理解能力“不在线”。
我们又让讯飞星火展现了文字创作能力——根据要求写一首诗。
这首诗基本涵盖了端午节的要素:糯米、龙舟、艾草,还拓展了龙舟、艾草等元素的使用场景,也表达了对生活的美好祝愿。但整体而言,与其说是一首诗,它更像是一首缺少押韵、对仗、与美感的顺口溜。
随后,全天候科技针对一些时下正流行的网络“热梗”进行提问,看其是否有紧跟热点的能力。
然而,对于“特种兵”式旅游这个网络热梗,讯飞星火知道一点,但知道的不多。不过,它的“态度”很好,当我们提出错误,它能认识到自己的错误,并且道歉。
在测试过程中,全天候科技发现,讯飞星火的部分语料库并未更新至最新事件,对一些实事仍然给出错误答案。比如,当我们问“北京冬奥会自由式滑雪女子U型场地冠军是谁”时,它给出的答案是:法国选手特兰斯·勒贝克 (TraceLeBerque)。不过,当我们给出正确答案后,它又立马承认自己的错误并道歉。
在数学推理能力方面,我们请讯飞星火做了几道数学题。对于第一个题,讯飞星火不仅给出了正确答案,还做了延伸。而对于第二个题,它给出了详细的解题步骤及正确答案。可以看出,它的简单数学推理能力过关。
在多模态生成方面,讯飞星火的表现也不够完美。
此前已经推出的百度文心一言、阿里通义千问等大模型均具备图片生成的能力。当我们输入“科大讯飞要开大模型发布会,请生成一张海报”时, 讯飞星火认知大模型告诉我们自己无法生成图片,但是它还是给我们提供了一些信息和建议。
除了文字,讯飞星火具备在答案中融入emoji表情包能力,当我们让它用emoji表情包介绍大模型发布会时,它给出了以下答案。
最后,讯飞火星究竟如何看待自己的能力?
我们抛出了刘庆峰对其已“超越ChatGPT”的夸赞,并让它证明自己。它没有承认,并已学会了“打太极”。
责任编辑:
标签:
- 黄山提升政府采购透明度 助力实体经济持续健康稳定发展
- 1-2月黄山新签“双招双引”项目103个 总投资额139.7亿元
- 池州海关共签发RCEP原产地证书22份 签证金额92.7万美元
- 宿州泗县深入推进文旅融合发展 擦亮城市品牌
- 河北工业生产平稳开局 固定资产投资较快增长
- 昆明西山区深入实施人才强区战略 建立健全招商招才引资并轨新模式
- 2月唐山新建商品住宅销售价格与上月持平 同比下降0.8%
- 去年河北电子信息产业实现主营业务收入2367.7亿元 同比增长22.4%
- 绥化望奎以工业化思维为引领 推动肉类加工制造产业腾飞
- 绥化市监局推出多项举措 大力促进有机产品产业发展
- 半路出家无心插柳 杭州西湖区“菌菇宝宝”变废为宝
- 温州鹿城区藤桥主打藤桥熏鸡 近两年销售额年均增长20%以上
- 1-2月安徽限额以上消费品零售额1030.4亿元 同比增长10.4%
- 2021年合肥市茶园面积13.6万亩 产值176350万元
- 淡季不忘引流 京郊民宿市场将很快迎来回暖
- 郴州安仁文旅项目集中开工 总投资1000万元
- 江苏服务业继续保持发展强劲势头 为高质量发展提供有力支撑
- 黄山休宁经开区摸排基础设施项目17个 计划总投资29709万元
- 前两个月宣城出口31亿元 增长34.4%
- 滁州凤阳2021年共接待游客225万人次 旅游综合收入20.25亿元
- 1-2月宿州市民间投资同比增长19.2% 居全省第3位
- 宿州严格审核把关 抢抓发行地方政府专项债券政策机遇
- 1-2月亳州市进出口总值5.5亿元 同比下降17.4%
- 合肥:弘扬茶文化 初步形成一条生态发展之路
- 合肥:建成“数字中国”领先城市 推进城市数字化转型
- 甘肃再续“艾黎情”:探职业教育德技并修
- 【城市守望者】致敬抗“疫”一线的“拆弹专家”
- 浙江绍兴越城区核酸检测结果公布 除1例阳性外其余均为阴性
- 内地首例奥密克戎变异株感染者身体状况如何?来自哪里?专家解读→
- 对变异病毒已有准备!关于中国新冠药物,钟南山发声→
- 江苏睢宁小网格大担当 织就乡村振兴“幸福网”
- 改造老旧小区 共享幸福生活
- 天津静海:群众在哪里,文明实践就延伸到哪里
- 齐齐哈尔:初步判断疫情感染来源为接触新冠病毒污染环境和物品
- 重庆大竹林派出所副所长因对群众态度简单粗暴被停职
- 黑龙江讷河病例感染源初步判断为新冠病毒污染的环境和物品
- 致敬2021
- 浙江瑞安民警捐献造血干细胞:14年前的心愿终将如愿
- “考研房”涨价离谱 律师:借机宰客有违市场伦理
- 广州白云机场:14天内有东莞旅居史的旅客须凭48小时核酸阴性证明乘机
- 浙江绍兴本轮疫情已报告确诊病例145例 无症状感染者1例
- 福建龙岩一男子和前妻斗气 扛着126斤硬币到法院“还钱”
- 重庆这座立交酷似“悟空” 走红 设计师揭秘(图)
- 青海警方破获特大电诈案 涉案流水高达1.7亿
- 云南新增境外输入确诊病例3例
- 黑龙江讷河市5名核酸阳性人员流调溯源:接触被新冠病毒污染的环境和物品
- 男子爱上女主播 假扮女主播闺蜜教其他男粉丝刷单
- 广西三市警方联手破获毒品案 全链条摧毁跨境贩毒团伙
- 广东东莞发现2例无症状感染者,部分镇今起全员筛查
- 从百二秦关到闻道凯旋 一个殉职医生最后的朋友圈
- 浙江发补充说明:三地铁路出行政策随风险等级同步调整
- 内蒙古新增本土确诊病例5例 均在呼伦贝尔满洲里市
- 陕西新增本土确诊病例1例 系隔离酒店工作人员
- 31省份新增新冠肺炎确诊病例76例 其中本土51例
- 浙江新增新冠肺炎确诊病例45例 其中本土44例
- 技能就是财富 技工也是人才
- 黑龙江新增本土确诊病例1例、本土无症状感染者4例
- 冷空气“调休”!我国大部陆续迎回暖 中东部雨雪稀少
- 华北黄淮等地大气扩散条件转差 冷空气将影响中东部
- 别误读了野猪或将不再是“三有”动物
- 您的ETC已到期?当心这个诈骗短信!
- 对回家的“宝贝”少一些关注,也是一种帮助
- 升温!北京今日阳光在线 最高气温将升至8℃
- 那年今日 | 一张漫画涨知识之12月14日
- 40岁男子一觉醒来突然听不见了 原因是……
- 本年度星空压轴大赏上演 双子座流星雨观赏地图来了
- 广东东莞大朗镇报告2例新冠肺炎无症状感染者
- 商丘4885份被盗出生证去哪了?10年“悬案”引关注
- 浙江海宁警方通报国家公祭日女子穿和服逛街
- 厨艺不精调料凑?懒人调料:年轻人的“下厨神器”
- “您的ETC已到期?”警方提醒:当心这个诈骗短信
- “网红”局长的热度 自述:走红后我就没有周末了
- 寻回被拐10年的儿子后又送走 儿子:害我没家了
- 小城里的三张面孔和警号301137
- 倡导“就地过年”,需因地制宜科学防疫
- 别用“入乡随俗”为星巴克找借口
- 北京地铁14号线年底全线贯通运营
- 天津市从入境人员中检出奥密克戎变异株
- “外滩活地图”黄俊:一个不想出圈的段子手交警
- 寻找一双儿女的25年
- 无锡市场监管部门责成星巴克涉事门店停业整改
- 海岛警事:为了一座岛和2900平方公里的海
- 北京民警宏福苑抗疫26天:“今夜我和雪花一起出发”
- 星巴克的“金标准”缘何败给了“潜规则”
- 患者被低价药“惊呆”的场面应该更多些
- 影视剧“超前点评”不止是“低级错误”
- “南昌鹦鹉案”下发不起诉决定书 网店上架费氏牡丹鹦鹉被拒
- 河南商丘4885份出生医学证明被盗始末追踪
- 绍兴市病例62-109活动轨迹公布
- 12月7日以来,杭州累计报告新冠肺炎确诊病例19例
- 浙江绍兴新增确诊病例37例 上虞区占36例
- 河南高院对张成功案作出死刑判决
- 四川一滑雪场停电游客被困索道 官方回应
- 浙江绍兴越城区新增1例新冠肺炎确诊病例 当地对防控区域划分进行调整
- 中国内地首次检出新冠病毒奥密克戎变异株
- 知网除了涉及著作权纠纷,是否涉嫌违反《反垄断法》?
- 浙江绍兴越城区新增1例新冠肺炎确诊病例
- 四川眉山千箱柑橘送往呼和浩特市抗疫一线
- 两名青年男女探险三亚落笔洞遗址被困沼泽 消防成功救援
- 中国地理学大会在福州发布《中国地理学界碳中和科技行动福州宣言》
广告
广告
- 热点在线丨这家大模型豪言半年内超越ChatGPT(内附测评)
- 中国经济处于复苏态势,A股后市机会在哪?_热议
- 硫酸新霉素滴眼液说明书_硫酸新霉素滴眼液的作用|世界快资讯
- 热议:“加码”数字经济 越城在下一盘什么棋?
- 董明珠4亿市值股份被冻结?格力电器:搞错了…… 全球微动态
- 九芝堂(000989.SZ):成都经营板块重点打造天麻钩藤颗粒、健肺丸等独家优势大品种,各品种逐一研究确定营销方案
- 朝阳区东湖执法队积极开展施工工地执法检查|世界焦点
- 快报:怀化税务举办青年开放式主题活动
- 吉林四平公安以“爱警惠警”提升民警“幸福指数”
- 福城街道驻蓝塘镇帮扶工作队开展柑橘种植技术培训活动_焦点热门
- 去渍油 清洗剂商品报价动态(2023-05-06)
- 克徕帝官网最新消息(克徕帝官网)
- 2023年一季度南非煤炭出口同比下降7.9% 全球报道
- 舰艇系列电视剧(舰艇电影)
- 同一控制下股权划转涉税问题_同一控制 环球热点评
- 540个楼道“大变身” 张家港高新区(塘桥镇)扮靓楼道点缀文明生活_环球新消息
- 世界资讯:郑好办郑州人才公寓小区列表一直加载怎么办?
- 孟凯
- 当前速递!梅婷王千源主演的电视剧_王千源主演的电视剧
- 2023北京怀柔区小升初入学政策问题解答(九问九答) 全球看点