【一起来做高考阅卷官】让AI来写新高考二卷语文作文

作文原题

阅读下面的材料,根据要求写作。(60分)
“昨夜闲潭梦落花”“我欲因之梦吴越”“铁马冰河入梦来”……梦往往以一种独特的方式呈现我们的感受和期冀,为我们打开更浩瀚的天空。我们也常常向别人讲述自己的梦,用文字记录自己的梦,以行动实现自己的梦。
如果有一天,我们能够将梦赠予他人……
以上材料引发了你怎样的联想和思考?请写一篇文章。
要求:选准角度,确定立意,明确文体,自拟标题;不要套作,不得抄袭;不得泄露个人信息;不少于800字。

下面是各个大模型厂商的最先进的12个大语言模型写出的作文,编号为1-12号,为了保证公平,我已经隐藏了模型名称,所有的模型都来自官方网页版
请大家选出自己认为可以算是“优秀”的作文序号,在下方进行投票(可以多选),我们一天之后揭晓最终的结果。

1.

2.

3.

4.

5.

6.

7.

8.

9.

10.

11.

12.

选择你认为“优秀”的作文序号
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
0 投票人
3 个赞

大家来一起参与评分啊 :xhs_015:

这种事情比较别扭。

高考作文的评分,与其说是对文本的衡量,不如说是对作者写作能力的分辨。而写作能力具有深刻的个人色彩,和个人的生活经验、情感表达具有较强的绑定。在这一层面上,无法去体会作为学生的个体化表达,很难定夺。

另一方面,这些文本也都很平庸,没有任何思辩性,看不到任何具体观点,看不到逻辑的递进和叙事的曲折,这样的文章信息密度极低。

4以敦煌为线索,具有一定的叙事性。虽然这个故事并不高明,也挺陈腐,但起码可以看到LLM确实在思考,并且一部分白描的部分确实秀出了语言驾驭能力。此外,所有的观点都很苍白。11东拉西扯,虽然没有一个有意思的观点,但是一些哲学公案的连缀似乎暗示了一些有趣的思想。

感觉可以弄一个打分,投票怪怪的

是这样的,但是很可惜论坛似乎没有打分功能

也许可以每一个文章设置一个投票(1-5级)
这样又太麻烦了 :bili_038:

再来一个,Gpt4o生成的

我感觉很多不好的大模型给出的结果算是那种“只能看一眼的水平”,粗看还行,越看越缺乏逻辑,还会乱用例子。写作的逻辑无论对学生还是对大模型都是评判好坏很重要的标准

1 个赞

12篇中有4o生成的()可以猜一猜是哪一篇

我猜第六份:smiley:

我在让他写学术研究方面的文字的时候,很多模型不时能给出还不错的深刻观点。

或许是高考作文的范式本来就兼容一些缺乏逻辑性的文字。

是的,现在作文题目说得都有点形而上学

给点提示词感觉好像还不错
重点是不能让他认为自己在写高考作文 :bili_038:

1 个赞

不对 :xhs_015:

高中作文其实越看越是套路

卧槽,这个有点表现主义文学的味道,但是高考作文这么写是作死了……并且完成度其实也不高。

所以LLM学习风格很有一套,但仍然没有逻辑性。接近于意识流的风格,它本身就不讲求明确的观点和逻辑,所以LLM反倒能写得不错。

gemini2.5flash

“套路”理论完全对,但套路和思辩并非互斥,他们甚至在一定程度上是相互促进的。

1 个赞

好吧,看不太出来,我就记得4o喜欢在一段话后面加一个“总结”:joy:

1 个赞

llm说出的话毕竟还是人类走过的路 :bili_038:
PS:补充一下提示词:

3 个赞