  
- 积分
- 24651
- 威望
- 24651
- 包包
- 139319
|

最新研究显示,ChatGP在创造性思维任务中或超越大部分人类6 r* \2 `$ i5 g) g8 T( \
来源:生物世界 2023-09-21 11:44
, W/ n+ }! _. v! [) r+ m该研究指出,ChatGPT等基于大语言模型(LLM)的AI对话机器人在创造性思维任务上或能超越一般人类,该任务要求受试者想出日常用品的替代用途(发散性思维的一个例子)。
3 i. [4 R4 y* N5 U: q挪威卑尔根大学、斯塔万格大学的研究人员在 Scientific Reports 期刊发表了题为:Best humans still outperform artificial intelligence in a creative divergent thinking task 的研究论文。
; K- c+ K/ G( }' @2 t0 s( w该研究指出,ChatGPT等基于大语言模型(LLM)的AI对话机器人在创造性思维任务上或能超越一般人类,该任务要求受试者想出日常用品的替代用途(发散性思维的一个例子)。不过,得分最高的人类受试者依然能超过对话机器人的最佳答案。
( f5 \& Y' O) J, A
1 C% {1 Q. Y2 G+ D发散性思维通常是指与创造性相关的一类思维过程,需要为特定任务想出各种不同创意或对策。发散性思维一般通过替代用途任务(Alternate Uses Task,AUT)进行评估,受试者被要求在短时间内想出某个日常用品的其他用途,越多越好。受试者的回答从四个类别进行打分:流利度、灵活性、原创性和精细度。+ \! C- S) l. n' ?5 |
在这项研究中,研究团队让ChatGPT3、ChatGPT4和Copy.Ai以及人类受试者完成四个物品(绳子、盒子、铅笔、蜡烛)的替代用途任务(AUT),并比较了AI和人类的答案。研究团队通过语义距离(回答与物品原始用途的相关度)和创造性给回答的原创性打分,他们用一个计算方法在0-2的范围里量化语义距离,同时让不知道作答者身份的人类打分者在1-5的范围里客观评价创造性。
6 T2 g. u9 S3 _ Z1 h8 D平均而言,AI的回答在语义距离(0.95 vs 0.91)和创造性(2.91 vs 2.47)的得分上显著高于人类的回答。人类回答在这两项的得分差距更大——最低分远低于AI的回答,但最高分普遍比AI高。最佳人类回答在 8个评分项中的7项都超过了所有对话机器人的最佳回答。
$ a( o) \1 ^1 n0 @) D这些结果表明,当前的AI对话机器人想创意的能力至少已与一般人类相当。但论文作者也指出,他们只评价了涉及创造性评估的单项任务的表现。作者认为,今后的研究或能探索如何将AI融入创造性过程来提升人类表现。
7 x+ _5 M0 p4 `6 Y- t8 I" K2 D
6 P) c" `' U" }+ a8 B |
附件: 你需要登录才可以下载或查看附件。没有帐号?注册
|