×

Loading...
Ad by
  • 最优利率和cashback可以申请特批,好信用好收入offer更好。请点链接扫码加微信咨询,Scotiabank -- Nick Zhang 6478812600。
Ad by
  • 最优利率和cashback可以申请特批,好信用好收入offer更好。请点链接扫码加微信咨询,Scotiabank -- Nick Zhang 6478812600。

ZT:科普智商人格

看到很多争论最后都会提到智商,人格什么的,我老就来科普一下,好让大家对这些东西有个大致明确的概念,不至于错得太离谱。

智商,大五人格,等等,这些概念,都是心理测量学的概念,而心理测量学,本质上就是统计学。所以,这些概念,不懂统计学,是无法真正理解的。

问题是,很多人以为自己数学很好,统计学很简单,其实不然。概率统计的直觉是一种独特的思维习惯,与传统数学的精确性思维非常不同。这种概率性思维,对绝大多数人来说,是非常不直观的。事实上,据我观察,大部分受过大陆正统数学和理科教育的人不具备概率性思维,所以思维是二分的,非黑即白,有时候看起来缺乏常识。而概率性思维认为一切命题的真假都是一个概率分布,有一定不确定性。所以有时候争论起来,鸡同鸭讲,无法沟通。这也是自然的。

智商,人格等等,这些东西,都是统计学因素分析(Factor Analysis)出来的因素,是纯粹的统计学概念,并没有任何其他的意思。最简单的因素分析,就是主成分分析(PCA),其实本质上就是矩阵分解,各大互联网公司的广告推送系统用得很多。其实因素分析,多维标度(multidimensional scaling),等等,不少统计方法,最早都是心理学家发明的,因为他们最早有这种需求。这些东西,后来也被计算机届拿来用了。

先说智商。各种智力活动,都可以有某种客观的指标来测量一个人在该项活动中的表现,比如上学可以看考试分数。心理学家发现人们在各种智力活动中的表现,有一定的相关性。一个人这门课学得好的,另一门课学得也好的可能性比较大。于是有心理学家就假设,可能有一个普遍的因素g,代表这种普遍的智力活动的能力。为了方便使用和运算,还假定这个因素g的分布符合正态(高斯)分布。

基于这些理论要求,心理学家就开始筛选智力相关的题目,通过用人来进行大量测试,筛选出一套题目来,让这套题的总分的分布来符合正态分布。这套题,就是智力测验,这套题分数的平均分,被指定为100分,标准差,被指定为15分。这就是所谓的智力商数IQ。比如一个人做这套题,得分130,意思就是说他的分数在两个标准差的地方,查正态分布表,他做这套题比95%的人要强;得分145,比99.7%的人要强,等等。

那这套题到底是好还是不好?这本身也是可以测量的。心理测量学用两类指标来测量一套题的好坏。

1. 信度,Reliability,就是看这个分数是不是可信。让我们把一套智力测题比作一把尺子,如果是一把好的尺子,测量同一个东西测几次,假定东西没变,测出的长度应该是差不多的。智力测验题也一样。同一个人,做这套题几次,每次他的分数是差不多的,这样这个分数就是可信的。信度高的题目,刷题就没有太多用处。

2. 效度,Validity,就是这个分数是不是真的测了我们想要测量的东西。这儿我们想要测量普遍的智力活动的能力,怎么办?自然是算这个分数与各种智力活动的表现的相关度。如果我们这套题的分数与各种其他智力活动的表现相关很高,比如0.8,0.9这样的,这套题就被认为效度还不错。

当然了,不同的智商题,测出的分数不同,不同题测量的侧重也不同。比如你的小孩想去上天才学校,这些学校入学承认的智商题,比如韦氏智力测验,是那种被试与测量员(一般是有执照的心理学家)面对面单独进行的,题目包括语言,常识,空间认知,思维速度,等等各个方面。这种测试因为有语言和常识这些东西在里面,与家庭文化有关,所以心理学家还发展了其他的跨文化类型的智力测验题,比如瑞文图形测验,就是全图形没有任何文字的测验。当然了,不同的智力测验,相互的相关度是相当高的,这也
是效度指标的一个方面。

智力测验,在西方社会目前被认为政治不正确,自从90年代全媒体批判美国心理学会背书的《钟型曲线》一书之后,不太敢有人提了。那本书是100年以来智商研究的一个总结,认为智商70%为遗传,30%为习得,有种族差异,等等,各种政治不正确的结论。SAT,ACT这些考试,其实是智力测验的变种,现在也要被废除了。这些东西,大家心里有数就行了。

人格测试,其实也是和智商测验同样的原理。而题目,传统是被试自己汇报型的,比如“我喜欢独处”,同不同意这句话,从1到7,选一个。目前公认的所谓大五人格测试,也是因为通过对大量上面这种人格测试题的因素分析,发现有五个因素总是出现,这个五个因素就被命名:外向性,宜人性,开放性,尽责性,和敏感性。其中尽责性与智商有一定的相关度,所以对学生GPA也有一定预测能力。大五人格也有各种应用,比如一些公司用大五人格来筛选高管,组建团队啥的。

以上为经典心理测量学的大概内容。

现代心理测量学,大体差不多,细节不太一样。主要是使用了项目反应理论,对每道题目的贡献进行更精细化的区分。从数学模型上说,经典心理测量是线性回归,现代心理测量是推广的线性回归,比如逻辑回归这种。

我老公司的一个贡献,就是用大数据来补充或者代替心理测量用到的题目。题目不是现做的,而是利用一个人已有的文字输出,比如社交媒体的贴啊,写的文章啊,与聊天机
器人聊的天啊,等等,来做心理测量。这样避免了人撒谎作假,提高信度,同时还大大降低了成本。我们文章,专利,都有一些了,其余还在进行中。

Report

Replies, comments and Discussions:

  • 枫下家园 / 望子成龙 / ZT:科普智商人格

    看到很多争论最后都会提到智商,人格什么的,我老就来科普一下,好让大家对这些东西有个大致明确的概念,不至于错得太离谱。

    智商,大五人格,等等,这些概念,都是心理测量学的概念,而心理测量学,本质上就是统计学。所以,这些概念,不懂统计学,是无法真正理解的。

    问题是,很多人以为自己数学很好,统计学很简单,其实不然。概率统计的直觉是一种独特的思维习惯,与传统数学的精确性思维非常不同。这种概率性思维,对绝大多数人来说,是非常不直观的。事实上,据我观察,大部分受过大陆正统数学和理科教育的人不具备概率性思维,所以思维是二分的,非黑即白,有时候看起来缺乏常识。而概率性思维认为一切命题的真假都是一个概率分布,有一定不确定性。所以有时候争论起来,鸡同鸭讲,无法沟通。这也是自然的。

    智商,人格等等,这些东西,都是统计学因素分析(Factor Analysis)出来的因素,是纯粹的统计学概念,并没有任何其他的意思。最简单的因素分析,就是主成分分析(PCA),其实本质上就是矩阵分解,各大互联网公司的广告推送系统用得很多。其实因素分析,多维标度(multidimensional scaling),等等,不少统计方法,最早都是心理学家发明的,因为他们最早有这种需求。这些东西,后来也被计算机届拿来用了。

    先说智商。各种智力活动,都可以有某种客观的指标来测量一个人在该项活动中的表现,比如上学可以看考试分数。心理学家发现人们在各种智力活动中的表现,有一定的相关性。一个人这门课学得好的,另一门课学得也好的可能性比较大。于是有心理学家就假设,可能有一个普遍的因素g,代表这种普遍的智力活动的能力。为了方便使用和运算,还假定这个因素g的分布符合正态(高斯)分布。

    基于这些理论要求,心理学家就开始筛选智力相关的题目,通过用人来进行大量测试,筛选出一套题目来,让这套题的总分的分布来符合正态分布。这套题,就是智力测验,这套题分数的平均分,被指定为100分,标准差,被指定为15分。这就是所谓的智力商数IQ。比如一个人做这套题,得分130,意思就是说他的分数在两个标准差的地方,查正态分布表,他做这套题比95%的人要强;得分145,比99.7%的人要强,等等。

    那这套题到底是好还是不好?这本身也是可以测量的。心理测量学用两类指标来测量一套题的好坏。

    1. 信度,Reliability,就是看这个分数是不是可信。让我们把一套智力测题比作一把尺子,如果是一把好的尺子,测量同一个东西测几次,假定东西没变,测出的长度应该是差不多的。智力测验题也一样。同一个人,做这套题几次,每次他的分数是差不多的,这样这个分数就是可信的。信度高的题目,刷题就没有太多用处。

    2. 效度,Validity,就是这个分数是不是真的测了我们想要测量的东西。这儿我们想要测量普遍的智力活动的能力,怎么办?自然是算这个分数与各种智力活动的表现的相关度。如果我们这套题的分数与各种其他智力活动的表现相关很高,比如0.8,0.9这样的,这套题就被认为效度还不错。

    当然了,不同的智商题,测出的分数不同,不同题测量的侧重也不同。比如你的小孩想去上天才学校,这些学校入学承认的智商题,比如韦氏智力测验,是那种被试与测量员(一般是有执照的心理学家)面对面单独进行的,题目包括语言,常识,空间认知,思维速度,等等各个方面。这种测试因为有语言和常识这些东西在里面,与家庭文化有关,所以心理学家还发展了其他的跨文化类型的智力测验题,比如瑞文图形测验,就是全图形没有任何文字的测验。当然了,不同的智力测验,相互的相关度是相当高的,这也
    是效度指标的一个方面。

    智力测验,在西方社会目前被认为政治不正确,自从90年代全媒体批判美国心理学会背书的《钟型曲线》一书之后,不太敢有人提了。那本书是100年以来智商研究的一个总结,认为智商70%为遗传,30%为习得,有种族差异,等等,各种政治不正确的结论。SAT,ACT这些考试,其实是智力测验的变种,现在也要被废除了。这些东西,大家心里有数就行了。

    人格测试,其实也是和智商测验同样的原理。而题目,传统是被试自己汇报型的,比如“我喜欢独处”,同不同意这句话,从1到7,选一个。目前公认的所谓大五人格测试,也是因为通过对大量上面这种人格测试题的因素分析,发现有五个因素总是出现,这个五个因素就被命名:外向性,宜人性,开放性,尽责性,和敏感性。其中尽责性与智商有一定的相关度,所以对学生GPA也有一定预测能力。大五人格也有各种应用,比如一些公司用大五人格来筛选高管,组建团队啥的。

    以上为经典心理测量学的大概内容。

    现代心理测量学,大体差不多,细节不太一样。主要是使用了项目反应理论,对每道题目的贡献进行更精细化的区分。从数学模型上说,经典心理测量是线性回归,现代心理测量是推广的线性回归,比如逻辑回归这种。

    我老公司的一个贡献,就是用大数据来补充或者代替心理测量用到的题目。题目不是现做的,而是利用一个人已有的文字输出,比如社交媒体的贴啊,写的文章啊,与聊天机
    器人聊的天啊,等等,来做心理测量。这样避免了人撒谎作假,提高信度,同时还大大降低了成本。我们文章,专利,都有一些了,其余还在进行中。

    • 人类对自身的认识还在很肤浅的阶段。由于社会资源的有限,
      用智商测试来分配一些资源也是情有可原的。只是在这过程中,由于这些测试本身的不完善,还有测试员自身的局限和偏见都会加重结果的不合理。很多时候机构做事太机械官僚,只是利用科学的外衣进行不公平资源分配,造成人们强烈反对这些测试,从而导致过度的政治正确。就是我们说的,歪嘴和尚念坏了经。如果智商测试只是个辅助手段,不要override 被测试人的passion 和drive ,也许会好很多。希望科学进步,社会进步,一切都变得更合理,公平些。