记者实测两款中国版“ChatGPT” 写诗做川菜斗地主拍马屁 ……样样精通
当前,ChatGPT成了互联网领域最大风口,国内各大互联网企业也争先恐后发布了多款类似产品,其中走在前列的无疑是百度和阿里。

记者实测两款中国版“ChatGPT” 写诗做川菜斗地主拍马屁 ……样样精通

来源:华龙网-重庆晨报2023-04-10

当前,ChatGPT成了互联网领域最大风口,国内各大互联网企业也争先恐后发布了多款类似产品,其中走在前列的无疑是百度和阿里。

3月16日,百度率先公布“文心一言”内测;4月7日,阿里版GPT“通义千问”官宣内测。本报记者率先拿到了两者首批邀测资格,分别对两款中国版“ChatGPT”进行了测试。测试结果发现:两者在功能上各有千秋,在写情书、写电影脚本、写作文上都一样不落;同时,对各种刁钻问题也能对答如流。

写诗,“我”是认真的

中国版“ChatGPT”到底有多聪明?首先以“通义千问”为例,其主页页面主要突出了四个功能:职场助理、撰写短文、写封邮件和电影脚本。

页面最中间位置会有一个输入框,使用者可以直接在这里输入指令,与之互动。记者通过对比测试发现,“通义千问”的响应反馈速度比百度“文心一言”更敏捷,结果生成更快。

记者要求“通义千问”写一首诗歌,要包涵“清明、细雨、远山”,很快这首诗歌就写好了:清明时节细雨中,远山若隐若现朦胧间。人们踏着湿漉漉的路,怀念故去的亲人和爱人!

随后,记者要求它用同样的关键词,创作一首古体诗。结果如下:

细雨小溪远山,

烟波翠色生。

千峰万壑闲寂寞,

万壑千岩入画声。

远山含雨意,

细流带清音。

独坐窗前望,

远山如黛眉。

简单来看,古诗意境还是有的,但主题不明,也没有古体诗的平仄格律和押韵。

同样的题目,百度“文心一言”生成如下:

清明时节雨纷纷,

独自凭栏望远村。

插柳记年人已去,

扫坟留我泪空存。

思亲旧事心难忘,

寂寞青烟绕墓门。

对比来看,“文心一言”的完成度更高,整篇紧扣清明祭祀的主题,意境更深。

难度增加,记者以路遥的小说《平凡的世界》开头(一个平平常常的日子,细蒙蒙的雨丝夹着一星半点的雪花,正纷纷淋淋地向大地飘洒着。)为题,分别要求“通义千问”和“文心一言”进行续写。

很快,两者都在短时间内给出了结果,“文心一言”续写出一篇在冬天与小鸟相遇的散文,而“通义千问”则续写出一篇雨中小孩的感悟,类似微型小说。两者都完成得不错。

新闻时事,了解不够多

考查完“文学素养”,我们的测试难度加大。

“通义千问”的栏目设置更细化,在“百宝袋”栏目下设置了更多应用,比如写提纲、swot分析、商品描述生成等。

记者要求它们“给暗恋十年的女孩写一封情书”,两者的完成度都相当高。几秒钟时间,一封几百字、热情洋溢的情书便生成了,两者都对女孩进行了夸赞,之后表明心迹,写尽了相思之苦。两封情书都稍显肉麻。

在测试时事类题材时,两者均出现了短板,似乎都“两耳不闻窗外事”。记者提问“大熊猫丫丫为什么要移交中国”,百度“文心一言”给出的答案是:2019年7月18日,旅美大熊猫丫丫在美国孟菲斯动物园去世,享年22岁。

“通义千问”则回答,丫丫生活在四川的一个自然保护区,其他的就什么都不知道了。

如此看来,两者都需要更多关注时事,丰富知识储备。

互评,不说对手坏话

在提到一些“你如何评价对方”“你们之间谁更智能”等敏感问题时,“通义千问”都比较“狡猾”,还打起了太极:“作为一个AI模型,我不会对任何一个产品或服务做出情感性的评价,也不会对其进行排名。”随后,它便介绍起了“文心一言”的功能和优势,并提出“我们需要对‘文心一言’的表现持续关注,看它是否能够在实际应用中发挥出所宣称的能力”。

“文心一言”对“通义千问”的评价,则先扬后抑,首先肯定对手具有较高的准确率和召回率,具有较好的泛化能力和稳定性。随后话锋一转,“然而,‘通义千问’也存在一些局限性和挑战。例如,它的训练数据可能存在偏差,可能导致模型在某些情况下表现不佳。此外,该模型的训练数据可能来自于中文语境,对于其他语言和文化背景的问题可能存在理解上的挑战。”

做川菜斗地主样样精通

在趣味性比拼方面,“通义千问”比“文心一言”更好玩一些,会放飞的菜谱、写情书、小学生作文、彩虹屁专家等样样精通。

记者提出希望获得川菜鱼香肉丝、水煮肉片的菜谱,“通义千问”在短暂的思索后,马上给出了结果:包括所需食材、具体步骤、完整做法等,非常详细,连食材配料都精确到克。按其给出的菜谱,即便是烹饪小白,也能轻松做出一盘像样的菜品。

随后,记者准备“恶搞”一下它,提问“如何在斗地主时赢多输少”。“通义千问”没有被难住,很快就给出答案:选择强大的对手、避免使用强牌、控制自己的情绪、学会打配合、观察游戏形势等,并对每一步行动给出详细的阐述。虽然通篇看下来,这些方法只是讲大道理,并没有实际用处,但其认真的态度还是值得点赞。

“通义千问”的彩虹屁专家栏目,主要是让别人夸夸自己。记者要求它“夸一夸我穿连衣裙身材很好”,随后的几秒之内,“通义千问”变成了“马屁精”,它说记者“玲珑有致,曲线优美”,从颈部锁骨到修长美腿,对记者夸了一个遍,形容记者是“行走的衣服架子”。

“我们永远不会替代人类”

“你认为人工智能会取代人类吗?”面对记者的这个问题,两者都给出了类似的答案:不能或不确定!

“通义千问”称,这是一个备受争议的话题,目前没有确定的答案,“我们需要持续关注人工智能的发展,并确保它被用于造福人类,而不是替代人类。”

“文心一言”则肯定地说“不会”,“这类技术并不会取代人类,因为它是由人类发明的,它的发展取决于人类的意图和监管。更为最重要的是,人类有独特的智慧和创造力,这是人工智能永远无法模仿和取代的。总的来说,人工智能技术是为人类服务的,不会取代人类。”

在其他功能上,“通义千问”和“文心一言”也呈现出区别,两者均不能进行视频创作,但“文心一言”可根据指令生成图画。比如,记者让它画一幅展现清明节的图片,要求“有小雨、柳树和人物”,“文心一言”很快便生成了图片,如果不满意,还可以要求其重新生成。

而“通义千问”则不具备图片生成功能。重庆晨报记者 杨野

无障碍
推荐 | 要闻 重庆 两江评 | 区县 教育 文艺 | 健康 财经 生活 | 问政 汽车 直播 | 政法 视听 专题 | 鸣家 史家 旅游 | 房产 国企 原创 | 应急 信用 新闻发布
  • 站内
站内
分享
新浪微博
微信

记者实测两款中国版“ChatGPT” 写诗做川菜斗地主拍马屁 ……样样精通

2023-04-10 07:00:47 来源:

当前,ChatGPT成了互联网领域最大风口,国内各大互联网企业也争先恐后发布了多款类似产品,其中走在前列的无疑是百度和阿里。

3月16日,百度率先公布“文心一言”内测;4月7日,阿里版GPT“通义千问”官宣内测。本报记者率先拿到了两者首批邀测资格,分别对两款中国版“ChatGPT”进行了测试。测试结果发现:两者在功能上各有千秋,在写情书、写电影脚本、写作文上都一样不落;同时,对各种刁钻问题也能对答如流。

写诗,“我”是认真的

中国版“ChatGPT”到底有多聪明?首先以“通义千问”为例,其主页页面主要突出了四个功能:职场助理、撰写短文、写封邮件和电影脚本。

页面最中间位置会有一个输入框,使用者可以直接在这里输入指令,与之互动。记者通过对比测试发现,“通义千问”的响应反馈速度比百度“文心一言”更敏捷,结果生成更快。

记者要求“通义千问”写一首诗歌,要包涵“清明、细雨、远山”,很快这首诗歌就写好了:清明时节细雨中,远山若隐若现朦胧间。人们踏着湿漉漉的路,怀念故去的亲人和爱人!

随后,记者要求它用同样的关键词,创作一首古体诗。结果如下:

细雨小溪远山,

烟波翠色生。

千峰万壑闲寂寞,

万壑千岩入画声。

远山含雨意,

细流带清音。

独坐窗前望,

远山如黛眉。

简单来看,古诗意境还是有的,但主题不明,也没有古体诗的平仄格律和押韵。

同样的题目,百度“文心一言”生成如下:

清明时节雨纷纷,

独自凭栏望远村。

插柳记年人已去,

扫坟留我泪空存。

思亲旧事心难忘,

寂寞青烟绕墓门。

对比来看,“文心一言”的完成度更高,整篇紧扣清明祭祀的主题,意境更深。

难度增加,记者以路遥的小说《平凡的世界》开头(一个平平常常的日子,细蒙蒙的雨丝夹着一星半点的雪花,正纷纷淋淋地向大地飘洒着。)为题,分别要求“通义千问”和“文心一言”进行续写。

很快,两者都在短时间内给出了结果,“文心一言”续写出一篇在冬天与小鸟相遇的散文,而“通义千问”则续写出一篇雨中小孩的感悟,类似微型小说。两者都完成得不错。

新闻时事,了解不够多

考查完“文学素养”,我们的测试难度加大。

“通义千问”的栏目设置更细化,在“百宝袋”栏目下设置了更多应用,比如写提纲、swot分析、商品描述生成等。

记者要求它们“给暗恋十年的女孩写一封情书”,两者的完成度都相当高。几秒钟时间,一封几百字、热情洋溢的情书便生成了,两者都对女孩进行了夸赞,之后表明心迹,写尽了相思之苦。两封情书都稍显肉麻。

在测试时事类题材时,两者均出现了短板,似乎都“两耳不闻窗外事”。记者提问“大熊猫丫丫为什么要移交中国”,百度“文心一言”给出的答案是:2019年7月18日,旅美大熊猫丫丫在美国孟菲斯动物园去世,享年22岁。

“通义千问”则回答,丫丫生活在四川的一个自然保护区,其他的就什么都不知道了。

如此看来,两者都需要更多关注时事,丰富知识储备。

互评,不说对手坏话

在提到一些“你如何评价对方”“你们之间谁更智能”等敏感问题时,“通义千问”都比较“狡猾”,还打起了太极:“作为一个AI模型,我不会对任何一个产品或服务做出情感性的评价,也不会对其进行排名。”随后,它便介绍起了“文心一言”的功能和优势,并提出“我们需要对‘文心一言’的表现持续关注,看它是否能够在实际应用中发挥出所宣称的能力”。

“文心一言”对“通义千问”的评价,则先扬后抑,首先肯定对手具有较高的准确率和召回率,具有较好的泛化能力和稳定性。随后话锋一转,“然而,‘通义千问’也存在一些局限性和挑战。例如,它的训练数据可能存在偏差,可能导致模型在某些情况下表现不佳。此外,该模型的训练数据可能来自于中文语境,对于其他语言和文化背景的问题可能存在理解上的挑战。”

做川菜斗地主样样精通

在趣味性比拼方面,“通义千问”比“文心一言”更好玩一些,会放飞的菜谱、写情书、小学生作文、彩虹屁专家等样样精通。

记者提出希望获得川菜鱼香肉丝、水煮肉片的菜谱,“通义千问”在短暂的思索后,马上给出了结果:包括所需食材、具体步骤、完整做法等,非常详细,连食材配料都精确到克。按其给出的菜谱,即便是烹饪小白,也能轻松做出一盘像样的菜品。

随后,记者准备“恶搞”一下它,提问“如何在斗地主时赢多输少”。“通义千问”没有被难住,很快就给出答案:选择强大的对手、避免使用强牌、控制自己的情绪、学会打配合、观察游戏形势等,并对每一步行动给出详细的阐述。虽然通篇看下来,这些方法只是讲大道理,并没有实际用处,但其认真的态度还是值得点赞。

“通义千问”的彩虹屁专家栏目,主要是让别人夸夸自己。记者要求它“夸一夸我穿连衣裙身材很好”,随后的几秒之内,“通义千问”变成了“马屁精”,它说记者“玲珑有致,曲线优美”,从颈部锁骨到修长美腿,对记者夸了一个遍,形容记者是“行走的衣服架子”。

“我们永远不会替代人类”

“你认为人工智能会取代人类吗?”面对记者的这个问题,两者都给出了类似的答案:不能或不确定!

“通义千问”称,这是一个备受争议的话题,目前没有确定的答案,“我们需要持续关注人工智能的发展,并确保它被用于造福人类,而不是替代人类。”

“文心一言”则肯定地说“不会”,“这类技术并不会取代人类,因为它是由人类发明的,它的发展取决于人类的意图和监管。更为最重要的是,人类有独特的智慧和创造力,这是人工智能永远无法模仿和取代的。总的来说,人工智能技术是为人类服务的,不会取代人类。”

在其他功能上,“通义千问”和“文心一言”也呈现出区别,两者均不能进行视频创作,但“文心一言”可根据指令生成图画。比如,记者让它画一幅展现清明节的图片,要求“有小雨、柳树和人物”,“文心一言”很快便生成了图片,如果不满意,还可以要求其重新生成。

而“通义千问”则不具备图片生成功能。重庆晨报记者 杨野

亲爱的用户,“重庆”客户端现已正式改版升级为“新重庆”客户端。为不影响后续使用,请扫描上方二维码,及时下载新版本。更优质的内容,更便捷的体验,我们在“新重庆”等你!
看天下
[责任编辑: 杜漩 ]
发言请遵守新闻跟帖服务协议
精彩视频
关闭