记者实测两款中国版“ChatGPT” 写诗做川菜斗地主拍马屁 ……样样精通

来源：华龙网-重庆晨报2023-04-10

当前，ChatGPT成了互联网领域最大风口，国内各大互联网企业也争先恐后发布了多款类似产品，其中走在前列的无疑是百度和阿里。

3月16日，百度率先公布“文心一言”内测；4月7日，阿里版GPT“通义千问”官宣内测。本报记者率先拿到了两者首批邀测资格，分别对两款中国版“ChatGPT”进行了测试。测试结果发现：两者在功能上各有千秋，在写情书、写电影脚本、写作文上都一样不落；同时，对各种刁钻问题也能对答如流。

写诗，“我”是认真的

中国版“ChatGPT”到底有多聪明？首先以“通义千问”为例，其主页页面主要突出了四个功能：职场助理、撰写短文、写封邮件和电影脚本。

页面最中间位置会有一个输入框，使用者可以直接在这里输入指令，与之互动。记者通过对比测试发现，“通义千问”的响应反馈速度比百度“文心一言”更敏捷，结果生成更快。

记者要求“通义千问”写一首诗歌，要包涵“清明、细雨、远山”，很快这首诗歌就写好了：清明时节细雨中，远山若隐若现朦胧间。人们踏着湿漉漉的路，怀念故去的亲人和爱人！

随后，记者要求它用同样的关键词，创作一首古体诗。结果如下：

细雨小溪远山，

烟波翠色生。

千峰万壑闲寂寞，

万壑千岩入画声。

远山含雨意，

细流带清音。

独坐窗前望，

远山如黛眉。

简单来看，古诗意境还是有的，但主题不明，也没有古体诗的平仄格律和押韵。

同样的题目，百度“文心一言”生成如下：

清明时节雨纷纷，

独自凭栏望远村。

插柳记年人已去，

扫坟留我泪空存。

思亲旧事心难忘，

寂寞青烟绕墓门。

对比来看，“文心一言”的完成度更高，整篇紧扣清明祭祀的主题，意境更深。

难度增加，记者以路遥的小说《平凡的世界》开头（一个平平常常的日子，细蒙蒙的雨丝夹着一星半点的雪花，正纷纷淋淋地向大地飘洒着。）为题，分别要求“通义千问”和“文心一言”进行续写。

很快，两者都在短时间内给出了结果，“文心一言”续写出一篇在冬天与小鸟相遇的散文，而“通义千问”则续写出一篇雨中小孩的感悟，类似微型小说。两者都完成得不错。

新闻时事，了解不够多

考查完“文学素养”，我们的测试难度加大。

“通义千问”的栏目设置更细化，在“百宝袋”栏目下设置了更多应用，比如写提纲、swot分析、商品描述生成等。

记者要求它们“给暗恋十年的女孩写一封情书”，两者的完成度都相当高。几秒钟时间，一封几百字、热情洋溢的情书便生成了，两者都对女孩进行了夸赞，之后表明心迹，写尽了相思之苦。两封情书都稍显肉麻。

在测试时事类题材时，两者均出现了短板，似乎都“两耳不闻窗外事”。记者提问“大熊猫丫丫为什么要移交中国”，百度“文心一言”给出的答案是：2019年7月18日，旅美大熊猫丫丫在美国孟菲斯动物园去世，享年22岁。

“通义千问”则回答，丫丫生活在四川的一个自然保护区，其他的就什么都不知道了。

如此看来，两者都需要更多关注时事，丰富知识储备。

互评，不说对手坏话

在提到一些“你如何评价对方”“你们之间谁更智能”等敏感问题时，“通义千问”都比较“狡猾”，还打起了太极：“作为一个AI模型，我不会对任何一个产品或服务做出情感性的评价，也不会对其进行排名。”随后，它便介绍起了“文心一言”的功能和优势，并提出“我们需要对‘文心一言’的表现持续关注，看它是否能够在实际应用中发挥出所宣称的能力”。

“文心一言”对“通义千问”的评价，则先扬后抑，首先肯定对手具有较高的准确率和召回率，具有较好的泛化能力和稳定性。随后话锋一转，“然而，‘通义千问’也存在一些局限性和挑战。例如，它的训练数据可能存在偏差，可能导致模型在某些情况下表现不佳。此外，该模型的训练数据可能来自于中文语境，对于其他语言和文化背景的问题可能存在理解上的挑战。”

做川菜斗地主样样精通

在趣味性比拼方面，“通义千问”比“文心一言”更好玩一些，会放飞的菜谱、写情书、小学生作文、彩虹屁专家等样样精通。

记者提出希望获得川菜鱼香肉丝、水煮肉片的菜谱，“通义千问”在短暂的思索后，马上给出了结果：包括所需食材、具体步骤、完整做法等，非常详细，连食材配料都精确到克。按其给出的菜谱，即便是烹饪小白，也能轻松做出一盘像样的菜品。

随后，记者准备“恶搞”一下它，提问“如何在斗地主时赢多输少”。“通义千问”没有被难住，很快就给出答案：选择强大的对手、避免使用强牌、控制自己的情绪、学会打配合、观察游戏形势等，并对每一步行动给出详细的阐述。虽然通篇看下来，这些方法只是讲大道理，并没有实际用处，但其认真的态度还是值得点赞。

“通义千问”的彩虹屁专家栏目，主要是让别人夸夸自己。记者要求它“夸一夸我穿连衣裙身材很好”，随后的几秒之内，“通义千问”变成了“马屁精”，它说记者“玲珑有致，曲线优美”，从颈部锁骨到修长美腿，对记者夸了一个遍，形容记者是“行走的衣服架子”。

“我们永远不会替代人类”

“你认为人工智能会取代人类吗？”面对记者的这个问题，两者都给出了类似的答案：不能或不确定！

“通义千问”称，这是一个备受争议的话题，目前没有确定的答案，“我们需要持续关注人工智能的发展，并确保它被用于造福人类，而不是替代人类。”

“文心一言”则肯定地说“不会”，“这类技术并不会取代人类，因为它是由人类发明的，它的发展取决于人类的意图和监管。更为最重要的是，人类有独特的智慧和创造力，这是人工智能永远无法模仿和取代的。总的来说，人工智能技术是为人类服务的，不会取代人类。”

在其他功能上，“通义千问”和“文心一言”也呈现出区别，两者均不能进行视频创作，但“文心一言”可根据指令生成图画。比如，记者让它画一幅展现清明节的图片，要求“有小雨、柳树和人物”，“文心一言”很快便生成了图片，如果不满意，还可以要求其重新生成。

而“通义千问”则不具备图片生成功能。重庆晨报记者杨野

记者实测两款中国版“ChatGPT” 写诗做川菜斗地主拍马屁 ……样样精通