当前位置:首页> 日语资讯

运用了【项目反应理论】【分数等化】等手法的日语能力考试怎么算分数?

发布时间:2020-12-01  来源:知乎  浏览:220

先写大家比较关心的几条结论:

【标准分】算分机制:

①题的整体正确率,大致决定了的【题的难度】
②你的整体正确率,大致决定了的【你的能力】
③全体考生的答题正误情况,决定了最终【题的难度】【题的区分度】等参数
④你连续做对的【题的难度】区间,决定了你的最终标准分

【标准分】会让丑小鸭逆袭,制造更多冷门吗?

①整体不会出现颠覆性逆转,丑小鸭还是丑小鸭,不会逆袭
②小范围内确实会因为 连续答中较难 的题而逆转

考生怎么获得【相对】高分:

①尽量做对 最能代表你能力 的题
②争取做对 比你的能力略难 的题

考生怎样会导致【相对】低分:

最能代表你能力 的题 连续失手
比你能力略差 的同学 连续超常发挥

什么题目是无关紧要的:

①“学霸都不会,学渣却蒙对”。这种影响考试可信度的烂题,计分前就已经被筛除掉
②“学霸失手也不怕,学渣蒙对也白搭”。远高于or远低于【你的能力】的题,答对答错都不太会影响你的最终标准分

考完日语能力考试能不能估分:

100%不可能。
因为你只知道【你的整体正确率】。
但是,
你不知道【别人的整体正确率】,
你不知道【什么题被剔除掉】,
你不知道【每道题的正确率】,
你不知道【什么题对你起作用】,
你不知道的太多,
估分器也把握不到整体情况……

所以,估分就别想了,100%不可能。

日语能力考试N2N1合格率大概多少:

N1合格率大概33.3%(3分之1)
N2合格率不到40%(5分之2)

如果你想知道以上结论怎么推导出来的,你就往下看。


【①】丑小鸭不会逆袭——整体上,【标准分】与【卷面分】正相关

根据日语能力考试官网【尺度得点】と【合格点の設定】,有这么一段介绍:

試験の難易度に依存しないテスト得点(尺度得点)を算出する具体的な手続きは、項目応答理論 (Item Response Theory; IRT)という統計的テスト理論に基づいています。この手続きは、正答数に 基づいたテスト得点(素点)の算出法とは全く異なります。

“考试得分(标准分)不依存于试卷的难度。其具体的计算过程,是基于【项目反应理论 (Item Response Theory; IRT)】的统计考试理论。这与基于正答数的得分(原始分)算法完全不同。”


为了分析【项目反应理论】的【标准分】与【卷面分】有什么关系,

①我在Excel制作了模拟考试数据(25题×100人)。

②我用【项目反应理论】的2pl(2参数)模型,在统计学软件R上算出了每道题的【难易度】【区分度】、每位同学的【能力值】;并进而估算出每位同学对每道题的【答对概率】。

③我将每位同学的【标准分(能力值)】和【卷面分(正答数)】进行比较。

从而得出第一个结论:

整体上,
【卷面分】和【标准分】依然呈现 正相关
丑小鸭并不会逆袭成白天鹅。


在上图中,有一些局部小范围的小逆转现象非常值得我们细细玩味。这些小逆转反映出了【项目反应理论(2PL模型)】计算出的【标准分】和【原始分】的差别。

【②】小范围内的小逆转——从【标准分】看【连续失手】vs【超常发挥】

还是日语能力考试官网【尺度得点】と【合格点の設定】,还有这么一段:

ある 2 名の受験者について、互いに正答数や解答パターンは違っていても、尺度得点が 同一になる場合もあります。逆に、正答数は同一であっても解答パターンが異なるため、尺度得点 が異なる場合もあります。  

“某2名考生,互相正答数或答题正误排列不同,标准分上也可能得分相同。反之,正答数相同,因为答题正误排列不同,标准分上可能得分不同。”


玄学!

我们来看看我们的数据中,高、中、低分区每部分的具体情况。


①【标准分】的高分区

下图我们可以看到,

有一位25道题答对21题(正确率:84%,下同)的S006同学,超过了4位答对23题(92%)、22题(88%)的同学,仅次于答对24题(96%)的S001同学。

ta何德何能,能位居【标准分】第二?



作者:教日语的小慌先生
链接:https://www.zhihu.com/question/29533142/answer/543773489
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

S006同学做对了最难的题目Q01,并且在一系列难题Q02~Q06之中连续得分。

其他四位没做对最难的题目Q01,并且在一系列难题Q02~Q06之中偶有失手。

另外我们发现,中低难度的题,貌似并没有对他们的排位分带来太大影响。


②【标准分】的中分区

下图我们可以看到,

有一位25道题答对17题(正确率:68%)的S022同学,超过了4位答对19题(76%)、18题(72%)的同学,与答对20题(80%)的S011、S012同学几乎持平。

ta何德何能,能在【标准分】与他们相提并论?



作者:教日语的小慌先生
链接:https://www.zhihu.com/question/29533142/answer/543773489
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

S022同学在一系列难题Q03~Q05之中连续得分。

而其他看似【卷面分】较高的同学,在这一系列难题之中却接连失手。

另外我们还是发现,中低难度的题,依然并没有对他们的排位分带来太大影响。


③【标准分】的低分区

下图我们可以看到,

有一位25道题答对8题(正确率:32%)的S089同学,超过了4位答对9题(36%)、10题(40%)的同学。

甚至有一位答对9题(36%)的S084同学,“骑”在三位答对11题(44%)的S075、S076、S077同学的头上!

ta们何德何能,能在【标准分】上如此放肆?


作者:教日语的小慌先生
链接:https://www.zhihu.com/question/29533142/answer/543773489
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

S089,S084同学答对较难的Q10题,并在中等难度的题Q10~Q16之中有超常表现。

而其他同学并没有答对较难的Q10题,并在这一系列中等难题之中却连续失手。

另外我们还是发现,低难度的题,依然并没有对他们的排位分带来太大影响。


于是,

从【标准分】的高、中、低分区中,我们都不断地得到同一个结论:

【标准分】能实现小范围内逆转。原因来自:
最能代表你能力 的题 连续失手 ;或者
比你的能力略难 的题 连续超常发挥

【③】整体考生分布中看【合格率】——【标准分】≈【排位分】

根据日语能力考试官网:過去の試験データ(2018年07月)

N1约有10.5万考生,合格率33.3%
N2约有14.4万考生,合格率38.4%

根据日语能力考试官网:過去の試験データ(2017年12月)

N1约有10.9万考生,合格率31.5%
N2约有14.4万考生,合格率35.5%

根据日语能力考试官网:過去の試験データ(2017年07月)

N1约有10.9万考生,合格率33.8%
N2约有14.5万考生,合格率43.9%

根据日语能力考试官网:過去の試験データ(2017年07月)

N1约有9.9万考生,合格率30.5%
N2约有12.0万考生,合格率35.5%

……


从2016年开始,能力考试会在考试结果上写上パーセンタイル順位(百分比顺位)。它的意思是:

最近3年的考生中,有百分之多少的人不如你。

跟你旁边的【标准分】有较为明显的对应关系。


于是我们又可以大概得出个结论:

N1合格率大概33.3%(3分之1)
N2合格率不到40%(5分之2)

以上就是有关日语能力考试的标准分算分方法的各种分析。

总结结论如下:

①不要用小学生加减乘除,去估算大学教授的统计学数学模型

②整体上丑小鸭不会逆袭,小范围内连续爆冷可能逆转

③尽量做对该对的题,争取做对略难的题

④“学霸都不会,学渣却蒙对”的烂题不计分

⑤“学霸失手也不怕,学渣蒙对也白搭”

⑥估分器就是个营销笑话,100%不准

⑦N1合格率大概3分之1,N2合格率不到5分之2