闲谈 059
有一段时间没有来更新了,最近工作的事、加上参加一个比赛,忙得不可开交。
之前在【闲谈 044】说过,要基于 GPT 研发「小而美」的产品。目前借助「人格与社会心理计算」的比赛,搭建了一个简单的网站,能够实现大语言模型的「分类」、「生成」和「对话」能力。
纷纷扰扰的世间,用作品社交、让作品说话,显得格外重要。第一个小的 GPT 作品已成型,今天提交了参赛的「技术报告」和「实现代码」。开始奔赴下一场比赛。
有一段时间没有来更新了,最近工作的事、加上参加一个比赛,忙得不可开交。
之前在【闲谈 044】说过,要基于 GPT 研发「小而美」的产品。目前借助「人格与社会心理计算」的比赛,搭建了一个简单的网站,能够实现大语言模型的「分类」、「生成」和「对话」能力。
纷纷扰扰的世间,用作品社交、让作品说话,显得格外重要。第一个小的 GPT 作品已成型,今天提交了参赛的「技术报告」和「实现代码」。开始奔赴下一场比赛。
@学叔 工作中经常会有客户来参观拜访,进来一个很大的感触是,如何将心理学知识通俗易懂的给外行讲清楚,真是一大本事。如果还能灵活运用,解释客户的种种疑惑,深入浅出、自圆其说,更是能力。毕竟心理学的一个目标就是要通过心理学视角,解释社会上的种种现象。
很多时候心理学同行有两个特点,一个是不敢轻易下结论,说话时带上「可能」或者「条件」,另一点是过度使用专业术语。
对于其它学科像物理、化学还好,像心理学这种带有哲学基因的学科,是自带科普属性的,就像书店很多畅销书肯定不会少心理学的一席之地。这说明大众是有深入了解心理学的动机和需求的,但是心理学同行们缺少「说人话、对人说」的能力,就造成了牛鬼横行的乱像。
比如解释「生理疲劳」和「心理疲劳」的区别,如果我们说心理疲劳是工作倦怠、是力竭性心理反应,恐怕没几个人能听明白,或者愿意听你吧啦吧啦解释不停。
但如果你说,「生理疲劳:心理想做,但身体无力」;「心理疲劳:身体有力,但心理不想做」,这样是不是就马上懂了。
或者像解释「焦虑」和「抑郁」区别,很多心理学同行都不一定能讲清楚,二者之间到底有什么区别。但如果说「想自杀是抑郁,不想自杀是焦虑」,虽然这样表达不一定中肯严谨,但至少简明扼要的讲清楚了二者的差异。先用「人话」黏住听众耳朵,后面再不断深入探讨,最后还能举例浅出,是谓学透。
心理学研究生硬技能对照表:
心理学研究生软技能对照表:
对于一些特种行业,心理学的测评筛查服务就是一种「政治性任务」,是对「公权力」的响应。并非出自市场真实需求,所以市场能够给予的反哺有限,无法给出切实的结果反馈,就不能形成有效的迭代正循环。所以很多心理学产品,都是外强中干,花活多,真材实料少,表面花里胡哨,其实底层理论都站不住脚。
对于这种作秀,其实做起来也要非常慎重,因为测评结果往往涉及到「标签问题」。这个测评结果,一旦落定,监管者很难不给测评对象贴上标签。尤其是心理筛查工作在很多行业,仍然是被污名化的,所以测评的等级、出具的风险名单,变相成为受测对象的「终身标签」,进一步影响其职业发展,更严重的还会酿成悲剧。
面对当下的信息洪流,牛鬼横行,培养足够能量的心理资本就显得格外重要。心理资本有别于社会资本、物质资本,它指的是一种积极的心理发展状态,解决人生发展中的「不忧、不惑、不惧」。
作为情绪能量的心理资本蓄水池,核心维护的是我们的「心力、心气」,也就是还在坚持真理与热爱,坚持做自己确认正确的事情,没有泯于众人。现在社会的躺平现象,其实是年轻人看不到奋斗的念头,心气被浇灭了。没有心气的能量支撑,怎会有面对狂风暴雨仍有「此心不动」的定气,淡定从容的洒脱,怎能达到「宠辱不惊,悲喜不动」的状态。
那么在这个操蛋的时代,如何保护自己的心气呢?
我们一生能读的书有限,大部分人不会超过 100 本,少部分人超过 1000 本,极少数人能看 10000 本。
读书,读好书,是最值得投资的一件事。买书,不计成本的买好书,@学叔 下一阶段争取实现「买书自由」。
6 年时间收藏 400 余本好书,为自己个人图书室达到 500 本藏书努力。买书不可不多,读书不可不知所择。
现在新型科研设备层出不穷,问卷量表作为心理学最早的技术研究手段,仍是不可或缺的。最近使用问卷量表较多,发现即便是信效度良好,发表在优质期刊上的这些问卷,仍有不少问题。
1)问卷题项的描述压根不尊重测试对象的文化水平,比如监狱犯人或者 JUN 队战 SHI,这些特殊人群的文化程度并没有想象的高,很多题目的描述方式很难理解词意,就必然会影响问卷的数据结果。尤其是一些题目能够直接描述,非要进行反而,或者否定句,这种方式不太能被很好理解。比如「非自愿入伍」。
2)题项的描述用词并非这些群体的通用话语,缺少内部针对性。很多用词都是偏社会的用词,并不是这些群体通常使用的交流内容,也会造成理解上的偏差。同时很多问卷都是上个世纪编制的,到了现代化社会,很多情境已然发生较大转变,题项的描述的情况已经不存在了。
3)如果问卷量表连最基本的「说人话」、「对人说」,都无法达到的话,那么结果可想而知。
今天把这个问题,给大家讲透一下,这个是 @学叔 去年拿到的一份「心理特质」检测报告。同样是摄像头的心理识别,只需要 30min。我们一起看下报告的几个问题:
「信息来源与报告有效性」部分,它强调「本报告所载的资料、意见及预测仅反映本公司专业人员基于发布本报告当日的专业判断,本报告所指称的相关事项均存在有重大突变的可能。」这句话基本上就是免责声明。等于说测评的变异性非常大,所以不准也是你们自己的问题。
它的测评「性格体质状况、心理健康状况、心理动力状况、心理能力状况、心因行为状况」这些维度,有非常多是稳定的特质和因素,所以这些测评因素是不应该有较大变异的。应该每次测评结果都是一样的才对,这样才能做基本的重复性验证。同时如果它对自己算法自信的话,可以提供一个标准的验证方法,比如怎么拍视频,什么类型的样本,就能得到特定的结果。如果能给出这个的话,信度还是能有一点保证的,信度其实就是稳定性对吧。如果这个都无法验证,并且测量两次,得到的结果偏差较大,尤其是在稳定特质上,那基本就是假的。
报告中提到它的算法「结合了生物统计学、生物测定学、生物热力学、生理心理学、机器视觉、机器学习等多学科理论」,这个其实核心的还是通过机器视觉来分析表情、面部的血流量情况(透皮血氧成像法)、面部图像的能量值,这几个特征来反映心理状态,其实科研领域也有这样做的。但是科研领域一般通过「面部表情」能够识别疲劳,像眨眼次数、瞳孔直径、打哈切次数等来定量分析,这个是比较成熟的方法。目前的科研成果也就在这个基础上进步一些,但他们这么丰富的指标,远远超出了科研领域能提供的基础成果支撑。说白了,可能没有太多理论研究成果和实际应用成果的支撑。同时它的问题还在于,没有「明确的场景、明确的任务」,如果脱离这两个就会让测评失去联系,可解释就变成了泛泛的结果而已。怎么解释、怎么说都对,无法进行明确的验证。所以情境化测评,就变得异常重要。这就是「生理」和「心理」的区别,「生理指标」比如医院体检,是不需要考虑情景的,直接测即可。但是「心理」的状态,非稳定的部分,和所处情境有非常大关系。
另一个严重问题是,机器学习算法需要有明确标签才能进行模型训练的,它的这些测评维度,其实很难得到真实、准确的标签,比如这个人焦虑情况下的表情、非焦虑情况下的表情,需要积累大量的面部表情数据,才能训练一个泛化能力强的模型。它这个报告测评维度这么多,每一项都需要单独得到真实标签,才能进行机器学习模型的构建,标签必须是独立的,不能重合。但是看它的【算法模型】部分,压根没有提到这个问题。
再就是基于一个维度数据(视频数据),很难得到这么丰富的测评指标,它是 25 项。这就类似你的一个验血结果,有 25 种解读的方法。但我们都知道验血的结果,是需要和其它检查结果、报告,相互辅助解读的。然后即便可以识别出这么多维度,识别的颗粒度其实也是比较粗糙的,就是压力大、压力小这种二分类的识别结果。从机器学习的角度,基本上不可能得到这份【分析报告】这么丰富、颗粒度这么详细的数值结果。
这套「智能算法」的做法 @学叔 猜测先收集一堆问卷数据,然后拍摄视频,用视频的特征和问卷数据做相关。这是比较通用的一种方法,倒也没问题,只是问卷结果本身就比较主观,然后再用视频结果做对应,如同空中楼阁,结果可想而知。如果他们问卷数据都没收集,直接对视频数据进行标签标定的话,可信度会更差。
所以你们看外人看起来很「高大上」的方案报告,在内行人眼里一文不值。这就是「精致的专业主义」。专业本质是「限制与精致」。专业人士在自己的领域掌握足够多的「条件化因素」,清楚每个结论的限制条件和前置条件;同时又可以在深度与广度上呈现求真之美,是为精致。外行与内行的区别是,外行的知识体系是没有限制的,任意使用、任意复用、任意滥用。
@学叔 在【闲谈 049】中讲到,心理学领域有很多外行乱入,可能大家感受不是特别深。给大家举个例子,可以看下这个文件中的十六项指标,是不是都属于心理学的研究范畴。但这是一帮搞计算机的人做出的产品。
「面部表情识别算法」共有十六个识别结果,分为「一般检测项」、「适应能力」、「生理状态」、「抑郁倾向」、「负面情绪水平」,五个维度。
整个报告文件具体的数值,就是 @学叔 本人的测评结果。如果让心理学专业同学做的话,那就是先花上两个小时,填十几个问卷量表,完事后手动分析,给出测评结果。整个过程半天时间过去了。
但这次测评,人家让 @学叔「盯着摄像头看 1min,然后等 2min 就生成报告」。所以你看 3min 能得到十几项检测结果,这对心理学行业完全是「压制性打击」,心理学专业人员扛不住这种技术轰炸的。
这样大家是不是清楚了一些,心理学的问题根源在哪?本质上还是没有「标准」,没有「标准」后果就是你无法评估它的算法结果「信效度」如何,因为你也给不出真实、正确的数值。如果有「标准」,很多外行是不敢乱入的,因为算法和指标要达到「一个标准」,才被心理学承认,不让就被打假。
并且在心理学领域,真的能识别出这种花哨技术背后精准性问题的专业人员,并不多。所以 @学叔 做的这个工作,创建「应用心理学技术工具箱」,掀起「应用心理学技术革命」,提升「应用心理学技术准入门槛」,把很多「牛鬼蛇神」挡在门外。这是 @学叔 对心理学的回馈。
今晚翻箱倒柜找一寸照片填资料,结果翻到了这份简报。这是 @学叔 毕业前夕写在论文致谢中的部分内容,发表在毕业生报的专辑上。数数日子,毕业届满四年,这期间做对了三件事,使得人生发展自由度变大。相比毕业前夕的稚嫩,已是云泥之别。
1)还保有与自己较劲的「心力」。正如毕业前夕对自己许下的承诺,步入社会,三年之期,再拿个社会大学的学位。@学叔 选的是人工智能,现今已掌握机器学习、深度学习技术,也有训练好的模型在实际产品中应用,算是初步入门。
2)这几年在坚持做大事、大项目、大产品,四年来坚守心理学阵地,换来国内顶尖的心理学资源和机会。作为负责人带领团队完成两个上千万级别的科研项目,设计三个有趣的心理学训练产品(全国独有),目前带队攻克的产品属于世界性难题。对于 @学叔 来讲,每一项工作都是极限压力测试,只要咬牙挺过来,就能认知升级、优化补丁。
3)作品矩阵的输出。这四年作品成果有在发表的文章、已授权的专利、在申请的几十项专利、翻译的第一本英文著作、开发的几个网站、编写的课程资料。
对于终身学习者来讲,每年想的是读万卷书,学百家才;对于创作者来讲,每月想的是千本过眼,只为一本输出;对于长期投资者来讲,每天想的是读好书、做大事、见高人。
人生如逆旅,你我皆行人。有限的职业生涯,做好一二,已属不易。人是世界上最好的产品,成为自己,是最大的奖赏。做好自己,就在那分分秒秒、滴滴答答。回望时光,溪水滴滴流淌,终会汇进大河,注入海洋。