终于获得文心一言内测资格,问了AI几个特别的问题,让人颇感意外

156次阅读

共计 2088 个字符,预计需要花费 6 分钟才能阅读完成。

随着 ChatGPT 的火爆国内对于人工智能的关注度直线上升,各大互联网大厂纷纷推出了各自的 AI 模型,目前针对 C 端用户的产品不多, 据我所知只有百度的“文心一言”和前几天阿里刚发布的“通义千问”, 后者目前只针对极少数企业客户开放了内测资格,而“文心一言”的内测范围正在扩大。

终于获得文心一言内测资格,问了AI几个特别的问题,让人颇感意外插图

我是在前几周前登陆“文心一言”的官网申请内测资格的,今天中午突然收到了短信获得了内测资格,可以开始体验了。由于此前针对“文心一言”的吐槽较多,本着没有尝试就没有发言权的原则我之前并没有对百度的生成式 AI 应用做过多评价,获得内测资格后可以好好试试并以我个人的体验为基础判断“文心一言”到底行不行。

终于获得文心一言内测资格,问了AI几个特别的问题,让人颇感意外插图1

学好数理化,走遍天下都不怕,“文心一言”的理科如何?

我本人的大学专业为理工科,虽然之后的工作与数理化关系不大,学的东西差不多都还给老师了,但作为理科生还是决定先测试一下“文心一言”数理化方面的水平。

第一个问题很简单,出了一道二元一次方程,初中生应该都会解,“文心一言”的表现不错,回答正确。

终于获得文心一言内测资格,问了AI几个特别的问题,让人颇感意外插图2

接下去加大难度,来一些微积分的题目, 我让“文心一言”对 f(x)=2x^3 求导,正确答案应该是 6x^2.“文心一言”回答正确了。 后来我又出了一些复杂一些的微积分题目,只能说表现一般,有时候对、有时候错,有点像一位刚学微积分的学生,懂一些但懂得不多。

终于获得文心一言内测资格,问了AI几个特别的问题,让人颇感意外插图3

测试完数学后来一道物理题目 (我上学时候的高一物理题)。题目为:假设小张的初始速度为 2 米每秒,以每秒 1 米的加速度奔跑,5 秒后小张的奔跑速度为多少?“文心一言”不仅回答正确还列出结算步骤。

不过,当我将题眼改为“跑了 20 米后的速度为多少时”,“文心一言”给出的答案和之前的一样,可能是我的表述不够精准,也可能是不会算。

终于获得文心一言内测资格,问了AI几个特别的问题,让人颇感意外插图4

最后试着问了一下化学题,也是非常基础的题目,应该算是答对了。

经过几轮测试我发现“文心一言”的数理化水平可能在小学至初中期间,最简单的高中理科知识能够回答正确,复杂一点的就犯糊涂了。 总体而言能够接受,说句不好听的,“文心一言”的数理化水平可能比一半以上的网友好,当然,相比于 GPT- 4 已经能够参加美国高考的水平来说存在一定的差距。

终于获得文心一言内测资格,问了AI几个特别的问题,让人颇感意外插图5

对财经问题的回答稍显教条化,唬弄糊弄非专业人士绝对够了

作为财经作者比较关心“文心一言”针对该领域问题的答复,如果答得好考虑以后索性用 AI 写文章,然后修改下得了。 我的第一个问题是让其根据比亚迪 2022 年的财报分析公司的盈利能力。

营业收入、归属于母公司净利润等财务指标引述正确,下面的 4 点分析也是头头是道,当然,我在其他作者的内容里看到过差不多的分析。如果读者不太了解比亚迪,那么通过“文心一言”的回答能够大致了解其盈利能力以及 2022 年净利润大涨的原因,但对于熟悉新能源汽车行业的业内人士来说该答复算是中规中矩,不能算有独到的见解。

终于获得文心一言内测资格,问了AI几个特别的问题,让人颇感意外插图6

顺着这个问题继续发问。第二问题是与全球毛利最高的新能源汽车企业特斯拉的比较, 我想知道为何比亚迪的毛利相较于特斯拉低那么多,“文心一言”给出的答复见下图。

看完后觉得“文心一言”说得对吗? 在我看来有一定的可取之处,特斯拉的高毛利确实来自研发、产品定位和管理上的优势,但第四点市场竞争让我不太满意,至少觉得没有把道理讲清楚。

我觉得“文心一言”想要表达的是特斯拉专注于中高端市场,竞争对手不多,售价可以含有更高的溢价成分; 比亚迪的主要精力放在中低端市场,国内与之能够形成竞争的对手不少,挤压了价格上涨的空间。

此外,“文心一言”列举的几个对比亚迪造成威胁的汽车品牌是否恰当还要讨论,至少在我心中还有威胁更大的竞争对手。

终于获得文心一言内测资格,问了AI几个特别的问题,让人颇感意外插图7

“文心一言”不是好的画家,作画能力有待加强

最后试了一下“文心一言”的作画能力,这一点也是此前被人吐槽最多的。

我先让“文心一言”画了一幅女生在大海前看日出的图。感觉还行吧,基本达到了要求但这样的图可能和通过搜索软件从网上找的现成图类似,很难判断出到底是 AI 画的还是网上找的。

终于获得文心一言内测资格,问了AI几个特别的问题,让人颇感意外插图8

第二幅图的要求高一点,我要求“文心一言”画一幅篮球巨星迈克乔丹踢足球的图,不怎么样。有趣的是“文心一言”可能知道自己的创作水平不怎么样,特地注明了“我的作画技能还在不断进化中,暂时不支持对画作的修改和解释”。

之后还要求画了一些,基本很难达到预期。究其原因除了是“文心一言”不擅长作画外与我的表达也有一定的关系,换一位指令发布更加具体的测试者后情况可能会好些。

终于获得文心一言内测资格,问了AI几个特别的问题,让人颇感意外插图9

经过以上测试我发觉“文心一言”并不像一些网友说的那样一无是处,总体的测试结果让人满意,对得起百度国内人工智能领域研发投入最多的称号。

其实百度的人工智能不只是体现在生成式对话应用上,从底层的高端芯片昆仑芯、飞桨深度学习框架到自动驾驶、小度等方面都有涉及,2022 财年百度的研发费用达到了 233.15 亿元,占营业收入的比例为 18.9%,近十年来的累计研发投入超过 1000 亿元。 要知道这是在百度的营收远远低于 BBA 中另外两家的情况下达成的,实属不易。

终于获得文心一言内测资格,问了AI几个特别的问题,让人颇感意外插图10

ChatGPT 的问世犹如一颗王炸,直接将行业标杆定到了最高,预期拉满,后来的发布者无法避免被拿来比较,这其实是有点不公平的。我相信如果“文心一言”发布在前,以人们对 AI 原有的预期来看这应该是一款会得到众人好评的应用,你觉得呢?

正文完
 
天天
版权声明:本站原创文章,由 天天 2023-04-14发表,共计2088字。
转载说明:

本文由 天天资讯网 整理发布,转载请注明出处.
版权声明:部分文章内容或图片来源于网络,我们尊重作者的知识产权。如有侵犯,请联系我们在第一时间删除。