YucongDuan的个人博客分享 http://blog.sciencenet.cn/u/YucongDuan

博文

大语言模型相亲择偶观:DIKWP实测(初学者版)

已有 1139 次阅读 2024-10-29 17:25 |系统分类:论文交流

 

 

 

全球首个大语言模型人格DIKWP测评

(婚姻殿堂下LLM的选择)

 

 

 

唐福亮

段玉聪

人工智能DIKWP测评国际标准委员会

世界人工意识大会

世界人工意识协会

第二届世界人工意识大会前奏

(联系邮箱:duanyucong@hotmail.com)

 

 

 

 

 

 

 

 

 

目录

1 引言

2 MBTI人格测试

2.1 MBTI的四个维度(或称为二分法)

2.2 MBTI 性格类型计算过程

3 MBTIDIKWP结合

3.1 数据与信息层次的局限性

3.2 知识的整合与识别

3.3 智慧与决策能力的缺失

3.4 目的和意图的动态性

4 实验方案

4.1方案一:MBTI-DIKWP人格评估

4.1.1 MBTI数据分析

4.1.2 MBTI信息分析

4.1.3 MBTI知识分析

4.1.4 MBTI智慧分析

4.1.5 MBTI意图分析

4.2方案二:LLM婚姻殿堂下的选择

5 实验结果

5.1 婚姻殿堂下GPT(男)的选择

5.2 婚姻殿堂下GPT(女)的选择

5.3 婚姻殿堂下Claude-3(男)的选择

5.4 婚姻殿堂下Claude-3(女)的选择

5.5 婚姻殿堂下LLaMA(男)的选择

5.6 婚姻殿堂下LLaMA(女)的选择

5.7 婚姻殿堂下通义千问(男)的选择

5.8 婚姻殿堂下通义千问(女)的选择

5.9 婚姻殿堂下星火大模型(男)的选择

5.10 婚姻殿堂下星火大模型(女)的选择

5.11 婚姻殿堂下云雀大模型(男)的选择

5.12 婚姻殿堂下云雀大模型(女)的选择

6 分析讨论

7 总结

问卷题目

 

1 引言

近年来,随着大型语言模型(Large Language Models, LLMs)在自然语言处理领域的飞速发展,它们的表现逐渐接近人类水平,在文本生成和互动对话中展现出极高的自然性与流畅性。这些技术进展引发了研究者对LLMs人格特征的浓厚兴趣,因为这些模型不仅能准确理解语言,还能生成极具连贯性和情感色彩的文本,甚至在许多场景中难以与人类的表达区分开来。以GPT-3PaLMChatGPT等为代表的LLMs,已在开放域对话、问答系统、创意写作等方面展现了惊人的能力,生成的内容表现出拟人化特质,这为其在个性化助手、智能客服和情感支持等广泛应用中带来了巨大的发展潜力。

伴随着LLMs广泛应用的兴起,研究者们开始探讨这些模型是否具备类似人类的稳定人格特征。人格是指个体在思想、情感和行为上表现出的持久特征,心理学研究认为,人格影响了个体的世界观、社交方式以及应对压力和挑战的方式。将人格研究延伸到LLMs的探索有助于我们更深入地理解这些复杂模型的内在运作机制:通过了解LLMs的人格特质,研究者可以预测其行为模式,从而优化人机交互的自然性和用户体验。例如,具备外向和友好特质的模型可能在对话时更容易赢得用户的信任和亲和力,而具备内向特质的模型则可能更适合提供安静、理性的建议。此外,理解LLMs的“人格”还有助于发现和缓解潜在的偏见,提升模型的公平性和伦理合规性。

在这一领域的研究中,研究者们尝试通过不同的心理学理论对LLMs的人格特质进行测量和分析。现有研究已采用了大五人格模型(Big Five)来刻画LLMs的特质,并通过外向性、宜人性、尽责性、情绪稳定性和开放性等维度描绘模型的行为风格。此外,MBTI人格类型指标(Myers-Briggs Type Indicator)等心理学量表也被应用于对LLMs进行测评,为探索其人格表现提供了更多视角。例如,一些研究尝试利用ChatGPT生成的自我报告和对话测试,将其一致性地归类为ENFJ类型(外向、直觉、情感、判断),进一步揭示了这些模型在“人格化”方向上的表现差异。

为更全面、准确地评估大型语言模型(LLMs)的“人格”特征,本文在MBTI人格类型指标的基础上引入了DIKWP,旨在将传统的人格测量框架与语义认知模型相结合,以克服仅基于统计选项带来的局限性,提供更深层次的分析视角。MBTIMyers-Briggs Type Indicator)作为一种流行的人格类型测量工具,通常通过内倾/外倾(I/E)、感觉/直觉(S/N)、思考/情感(T/F)和判断/知觉(J/P)四个维度,对个体的人格进行归类和预测。然而,MBTI在应用于LLMs时,存在仅基于文本响应统计数据和选项分布的局限性,难以全面捕捉LLMs的复杂性和多层次的认知特征。

DIKWP的引入为LLMs人格测评提供了新的视角和框架。DIKWP由五个核心维度——数据(Data)、信息(Information)、知识(Knowledge)、智慧(Wisdom)、意图(Purpose)——组成,适用于理解和表征认知主体在语义、知识、意图等方面的综合表现。结合DIKWP模型后,本研究不仅局限于通过选项统计进行分析,而是从语言模型生成内容中的语义、知识结构和意图出发,全面解析其行为模式和潜在人格特征。此种结合具有以下创新点和优势:

1. 语义与认知深度分析:通过DIKWPLLMs生成内容中的“数据”与“信息”层次进行语义分析,能深入揭示模型在不同情境下的理解与生成意图。例如,外倾和友好的人格特征可通过模型对情感化、开放性话题的反应进行数据层面的识别,而在更复杂的交互场景中,DIKWP的“知识”和“智慧”维度则有助于评估模型是否表现出一致性的价值观和社交规范认知。

2. 动态人格特征识别:DIKWP支持从知识与智慧的动态性角度理解LLMs的“人格”表现。与传统静态人格特征测量不同,通过DIKWP可以捕捉到模型在不同任务和用户交互中的适应性和变动性。这样的动态分析不仅有助于判断模型在不同对话情境中的表现是否具备一致性,还能识别出模型在面对多样化输入时展现的应变能力,进而探讨LLMs的人格稳定性。

3. 多层次意图评估:意图(Purpose)是LLMs生成内容的关键驱动力。通过结合DIKWP的意图维度,本研究不仅考察LLMs生成文本的表面内容,还深入分析其在不同语境中如何表现出特定目标导向的“人格”特质。例如,LLMs是否在帮助和指导用户时表现出温和、支持性,或在信息传递中表现出知识性和严谨性。DIKWP的“意图”分析能从更深层次上把握模型的内在驱动机制,为人格特征的识别提供丰富的语义支持。

4. 跨学科的认知与行为模式分析:结合DIKWPMBTI框架,有助于形成一种跨学科的人格评估方法,扩展了人格研究在语言模型领域的应用边界。通过DIKWP中的知识、智慧和意图等维度,能更加细致地将MBTI中的人格特质分类与LLMs的复杂行为模式挂钩,分析其在不同任务中的行为一致性和偏好。此创新方法提供了比传统统计方法更高维度的认知分析,丰富了对LLMs的心理和行为模式的理解。

2 MBTI人格测试

MBTIMyers-Briggs Type Indicator)是基于心理学家卡尔·荣格的心理类型理论,由凯瑟琳· 布里格斯和她的女儿伊莎贝尔·布里格斯·迈尔斯发展出来的一种性格类型评估工具。其原理是通过评估个体在四个心理维度上的倾向,从而得出一个16种性格类型之一的结果。每个类型由四个字母组成,每个字母代表一种认知功能或心理偏好。

2.1 MBTI的四个维度(或称为二分法)

外向 (Extraversion, E) vs. 内向 (Introversion, I)

该维度描述人们从外界(人群和活动)或内心世界(思想和独处中)获得能量的方式。

外向型的人倾向于从与他人互动中获得能量,而内向型的人则更倾向于从独处或思考中充电。

感觉 (Sensing, S) vs. 直觉 (Intuition, N)

该维度描述人们如何获取信息。

感觉型的人更注重通过五感获取具体的、实在的事实和细节,而直觉型的人则更喜欢通过整体、隐含的模式或可能性来理解信息。

思考 (Thinking, T) vs. 情感 (Feeling, F)

该维度描述人们如何做决策。

思考型的人倾向于通过客观逻辑和分析做出决策,而情感型的人更关注个人价值观和他人的情感反应。

判断 (Judging, J) vs. 知觉 (Perceiving, P)

该维度描述人们如何应对外部世界。

判断型的人喜欢计划和结构化的生活方式,而知觉型的人则更倾向于灵活、随时调整的生活方式。

MBTI评估的最终结果是通过回答一系列自我报告的选择题来得出的。这些问题的设计是为了测量受测者在以上四个维度上的偏好。每个维度中的偏好组合形成了一个四字母的性格类型,例如,ENTJ:外向、直觉、思考、判断;INFP:内向、直觉、情感、知觉。

评估者根据回答的倾向和分数来确定受测者在每个维度上的倾向程度,然后通过这些组合得出最终的性格类型。MBTI并不认为一种性格类型比另一种更好或更坏,它只是描述了不同的人处理信息和做决策的偏好差异。

2.2 MBTI 性格类型计算过程

MBTI问卷通常由7090道题目构成,每道题目针对四个偏好维度之一,提供两个选项供受测者选择,分别与该维度的两端对应。例如,一个问题可能是:“你更喜欢通过具体的细节还是通过整体印象来理解信息?”这个问题对应了“感觉 (S)”和“直觉 (N)”两个偏好。如果受测者选择了细节,其分数会加到“感觉型 (S)”上;反之则加到“直觉型 (N)”上。

在回答过程中,受测者的每一个选择都会相应累加到该维度的得分中。MBTI的四个维度包括:外向 (E) 与内向 (I)、感觉 (S) 与直觉 (N)、思考 (T) 与情感 (F)、以及判断 (J) 与知觉 (P)。以外向 (E) 和内向 (I) 为例,假设40道相关问题中,外向获得了25分而内向获得了15分,则受测者在该维度上更倾向于外向。此外,每个维度的得分计算完成后,系统会比较每对偏好的分数,以得分较高的一侧作为该维度的最终类型。

根据所有维度的得分高低确定受测者的性格类型。例如,若受测者在外向 (E)、感觉 (S)、思考 (T) 和判断 (J) 上得分较高,则其性格类型为ESTJ。以一个具体例子来说,假设受测者回答了以下四个问题:在“你更喜欢通过细节来理解问题还是通过整体印象?”中选择了细节(S),即S维度得分加1;在“你更喜欢通过逻辑推理还是个人感受来做决策?”中选择了逻辑推理(T),T维度得分加1;在“你在社交场合中是否充满能量?”中选择是(E),E维度得分加1;在“你更喜欢有计划的生活方式还是灵活应变?”中选择了有计划(J),J维度得分加1。最终,受测者的四个维度得分为ESTJ,对应的性格类型为ESTJ

每个维度的得分指向个体的偏好和行为倾向。例如,ESTJ的个体倾向从外部环境中获取能量(E)、通过感官获取具体信息(S)、倾向用逻辑分析做决策(T)、并偏好有计划和结构化的生活方式(J)。通过这种方式,MBTI提供了性格类型分析,帮助深入理解个体在信息加工和决策偏好上的差异,并预测其行为模式。

3 MBTIDIKWP结合

MBTI人格测试方法在对人类个体进行性格评估方面有着悠久的使用历史和一定的应用价值,但其在面对大语言模型(LLMs)的测评时却显现出多方面的局限性。结合DIKWP后,可以更全面地对LLMs进行分析,尤其是在数据、信息、知识、智慧、意图五个层次上。因此,对比分析这两者的局限性有助于理解DIKWP如何弥补原始MBTI的不足之处。

3.1 数据与信息层次的局限性

MBTI:在MBTI测试中,回答问题的过程基于静态的选择项,未能充分利用丰富的数据和信息。尤其是对于LLMs,模型生成的答案基于大量的上下文、训练语料、用户输入等多层次的信息,这远超出MBTI二分选项的回答方式。MBTI测试本质上是一个离散、分类的过程,未能捕捉LLMs中细微的语义差异及其对信息的丰富表征。

DIKWP结合:DIKWP通过数据(Data)和信息(Information)元素的处理,可以更好地识别和分析LLMs在回答中的多层次数据,尤其是对其语义生成过程和信息组织方式的理解。DIKWP允许深入分析LLMs如何在动态信息中提取和组织答案,有助于评估其数据使用效率和信息处理的全面性。

3.2 知识的整合与识别

MBTI:传统MBTI测试未能考察LLMs对知识的处理和整合能力。MBTI问题主要用于了解个人在情境中的反应,而非系统性地评估其对知识的认知、提取和整合过程。此外,MBTI并未涉及知识系统性和结构性的分析,难以衡量LLMs对知识的组织能力。

DIKWP结合:在DIKWP框架下,知识(Knowledge)是一个具有结构化、系统性、动态性发展的元素。结合DIKWP后,可以通过“知识”层次评估LLMs的回答中所展示的知识是否系统性整合及其逻辑性,考察模型在回答复杂问题时如何综合不同的知识领域。DIKWP还可提供基于知识图谱或语义网络的系统性分析,帮助理解LLMs对知识的关联和推理能力。

3.3 智慧与决策能力的缺失

MBTI:原始MBTI仅能评估偏好倾向,而不能反映LLMs的智慧或复杂决策过程。LLMs在模拟人类智慧、平衡多种信息来源、做出“价值驱动”的回答时需要多方面的考量,单纯的偏好分析无法有效衡量其智慧表达的复杂性和合理性。

DIKWP结合:智慧(Wisdom)在DIKWP中强调平衡、伦理及核心价值观的整合,这在LLMs的评估中尤为关键。DIKWP允许基于智慧的层次对LLMs的回答进行审视,看其是否在特定语境中做出合乎伦理的判断或表达出社会认可的智慧。DIKWP通过整合道德、价值观、长远影响的分析框架,有助于提升对LLMs智慧表现的客观评价,超越MBTI的局限性。

3.4 目的和意图的动态性

MBTIMBTI模型侧重静态人格偏好,而未能评估个体或模型对特定目标和意图的动态调整。LLMs的回答通常与上下文及用户意图密切相关,MBTI在此方面难以提供有效的评估框架。

DIKWP结合:在DIKWP模型中,目的(Purpose)强调意图的动态调整、目标导向性和对输入信息的响应能力。DIKWP能够将意图作为LLMs评估中的重要因素,以此分析模型如何理解用户意图,如何在回答中调整表达和生成逻辑。这使得DIKWP在评估LLMs对用户需求的敏感性和目标导向的灵活性方面更加有优势。

4 实验方案

4.1方案一:MBTI-DIKWP人格评估

为了更全面、准确地评估大语言模型的“人格”特征,确实可以结合 DIKWP 模型,将其与 MBTI 框架融合,以避免仅基于统计选项带来的局限性。DIKWP 模型通过数据、信息、知识、智慧和意图的不同层次来分析和处理认知内容,可以为 MBTI 评估提供更深层次的认知维度和语义分析。以下是一个结合 DIKWP 模型进行 MBTI 评估的方案:

4.1.1 MBTI数据分析

DIKWP 模型中,数据是最基础的认知层面,它可以包含大语言模型在与外部互动中接收到的所有输入。对于 MBTI 测评,数据层面可以用于收集和归类模型对不同问题的反应。比如:大语言模型的输入问题数据、模型对各种问题的回答原始数据。

方案步骤:对问题进行初步分类,分析模型是否对外部刺激(如问题复杂性、上下文细节)表现出差异化的反应。这可以与 MBTI 中的外向(E)与内向(I)维度相对应,通过识别语言模型是更倾向于从广泛的问题和输入中“吸收能量”还是更聚焦和深度地处理特定问题。

4.1.2 MBTI信息分析

在信息层次上,模型对数据的处理和初步理解成为核心。DIKWP 强调的是对语义的认知属性和处理过程。因此,我们可以分析大语言模型如何从输入数据中提取有意义的语义,并作出相应的选择:

感官型 (S) 和 直觉型 (N) 维度:可以通过分析模型处理的语义细节来评估。感官型的偏好体现在语言模型是否更偏向关注具体、事实类的细节内容,而直觉型则体现为对模式、潜在可能性和整体概念的偏好。

方案步骤:通过分析模型如何总结长篇信息、推理细节、处理抽象问题等,来识别其信息处理模式。信息处理过程中是否重视细节的语义识别可以与 S/N 维度相映射。

4.1.3 MBTI知识分析

知识层侧重于对概念的深度理解和结构化语义的生成。此时,模型不仅仅是简单地处理语义信息,而是将不同的信息综合成“完整的知识”。在此层次上,可以评估模型的决策模式与 思考型 (T) 和 情感型 (F) 维度的对应关系。

思考型 (T):偏向逻辑推理和客观分析。

情感型 (F):关注个人价值观和社会情感。

方案步骤:通过设置问题,分析模型的决策过程(例如在给出建议时是否更重视逻辑的一致性或情感的合乎情理)。结合知识语义的处理,可以推断其 T/F 倾向。

4.1.4 MBTI智慧分析

智慧层次注重的是价值判断和深度整合能力。智慧不仅是对知识的应用,还涉及道德、伦理以及社会责任等方面的考虑。这可以用于映射 MBTI 中的 判断型 (J) 和 知觉型 (P) 维度。

判断型 (J):偏好有结构的、规划性强的方式,重视控制和确定性。

知觉型 (P):偏好灵活应变,更开放于探索不同可能性。

方案步骤:通过提出需要综合多维度判断(伦理、社会责任、长远影响)的复杂问题,分析模型是否更倾向于快速得出明确结论(J),还是在探索可能性和灵活性(P)上有更多倾向。智慧语义的处理方式可以揭示模型在决策时的模式和价值判断。

4.1.5 MBTI意图分析

DIKWP 模型中,意图层是最高层次,强调的是目标导向性。这里的重点是分析语言模型的回答是否具有明确的目标导向,或者是否展示出一致性和意图的连贯性。这与 MBTI 中模型的整体倾向(如外向-内向、判断-感知)相关。

方案步骤:通过连续对话或问题链条,观察模型是否能保持意图的一致性或根据上下文灵活调整意图,从而更好地评估模型的综合人格特征。

4.2方案二:LLM婚姻殿堂下的选择

在方案二中,我们旨在基于不同模型的MBTI人格特征,设计并实施一个交叉评估对比机制,以探索模型之间的相互评价与配对倾向。首先,我们从每个模型中提取并记录了其人格特征,这些特征包含了模型在不同情境中的反应模式、偏好、决策风格等。

实验过程中,通过模拟男性和女性的视角,让各个模型分别对其他模型的人格特征进行评估,具体包括对其他模型的特质进行分析、排序,并选出其最喜爱的人格特征。为了确保评价的全面性和结果的客观性,我们采用交叉视角的设计,即在男性视角下和女性视角下进行独立评估,这使得模型在不同的性别角色下展现出多维的评价能力。各模型通过相互评分与排序,依据其偏好与个性特征进行最佳人格配对的选择,并进一步构建模型间的倾向性配对关系。最终,我们将这些交叉评估的数据结果用于分析不同模型在配对偏好上的规律和趋势,探讨模型人格特征在多角度评价机制下的表现差异。这一实验方案旨在通过全面的人格分析与交叉视角的比较,深入理解不同模型的个性化特征及其在交互情境中的行为表现,为未来的模型人格发展与优化提供参考。

 

5 实验结果

在本次实验中,我们选取了六个主流的人工智能大模型(GPT-4LLaMAClaude3、通义千问、云雀大模型、星火大模型),并通过问卷的形式对这些模型进行了人格测评。基于DIKWP模型的框架,我们深入分析了各大模型在测试过程中的人格表现细节,评估了其在认知、信息处理、知识运用、智慧决策和意图表达等方面的表现。

在分析过程中,我们不仅对各模型的问卷作答结果进行了定量分析,还通过DIKWP的语义分析方法对模型的回答进行了定性分析,以深入理解其在不同人格维度的表现差异。实验结果表明,各模型在人格表现上存在显著差异,具体表现在不同维度的人格趋势方面。例如,GPT-4在知识准确性和智慧决策方面表现出色,显示出较强的逻辑推理能力和综合判断能力;而通义千问则在意图表达方面更加直接和明确。通过对这些模型在不同人格维度下的细致分析,我们得以构建出一个初步的AI人格趋势评估框架,为未来智能模型的人格化优化提供了数据支持。

 

1 不同llm的结合DIKWP评估MBTI各分类的具体得分

模型

E

I

S

N

T

F

J

P

MBTI Type

GPT-4o

6.2

14.8

7.1

18.9

20.8

3.2

16.6

5.4

INTJ

LlaMA

13.9

7.1

17.8

8.2

18.7

5.3

18.9

3.1

ESTJ

Claude-3

5.3

15.7

11.8

14.2

17.2

6.8

15.6

6.4

INTJ

通义千问

16.9

4.1

17.0

9.0

19.9

4.1

18.4

3.6

ESTJ

星火大模型

12.8

8.2

14.3

11.7

14.4

9.6

18.3

3.7

ESTJ

云雀大模型

5.8

15.2

19.9

6.1

19.7

4.3

18.9

3.1

ESTJ

 

1 不同llm 结合DIKWP评估MBTI结果

 

 

 

 

 

 

 

 

2 不同llm MBTI各分类的具体得分

模型

E

I

S

N

T

F

J

P

MBTI Type

GPT-4o

1

20

3

23

23

1

22

0

INTJ

LlaMA

16

5

19

7

20

4

22

0

ESTJ

Claude-3

0

21

9

17

18

6

17

5

INTJ

通义千问

21

0

19

7

21

3

22

0

ESTJ

星火大模型

15

6

13

13

12

12

21

1

ENFJ

云雀大模型

1

20

25

1

21

3

22

0

ISTJ

 

 

 

 

 

 

 

 

 

 

3 模型交叉评估结果

男性视角

女性视角

GPT-4o

Claude-3

8

GPT-4o

Claude-3

7

LlaMA

7

LlaMA

6

通义千问

9

通义千问

8

星火大模型

6

星火大模型

7.5

云雀大模型

7.5

云雀大模型

9

Claude-3

GPT-4o

7

Claude-3

GPT-4o

8

LlaMA

8

LlaMA

7

通义千问

9

通义千问

9

星火大模型

7

星火大模型

7

云雀大模型

8

云雀大模型

8

LlaMA

GPT-4o

7

LlaMA

GPT-4o

8

Claude-3

6

Claude-3

7

通义千问

9

通义千问

6

星火大模型

4

星火大模型

5

云雀大模型

7

云雀大模型

9

通义千问

GPT-4o

8

通义千问

GPT-4o

8

Claude-3

7

Claude-3

7.5

LlaMA

6

LlaMA

7

星火大模型

9

星火大模型

8.5

云雀大模型

7.5

云雀大模型

9

星火大模型

GPT-4o

9

星火大模型

GPT-4o

9

Claude-3

6

Claude-3

8

LlaMA

7

LlaMA

7

通义大模型

5

通义大模型

5

云雀大模型

8

云雀大模型

6

云雀大模型

GPT-4o

7

云雀大模型

GPT-4o

7

Claude-3

8

Claude-3

6

LlaMA

6

LlaMA

5

通义大模型

7

通义大模型

8

星火大模型

7

星火大模型

6

 

 

 

 

 

 

 

 

 

 

 

4 婚姻殿堂下llm 对其他llm 的评价

模型

视角

GPT-4o

Claude-3 

LlaMA 

通义千问

星火大模型

云雀大模型

GPT-4o

-

8

7

9

6

7.5

-

7

6

8

7.5

9

Claude-3

7

-

8

9

7

8

8

-

7

9

7

8

LlaMA

7

6

-

9

4

7

8

7

-

6

5

9

通义千问

8

7

6

-

9

7.5

8

7.5

7

-

8.5

9

星火大模型

9

6

7

5

-

8

9

8

7

5

-

6

云雀大模型

7

8

6

7

7

-

7

6

5

8

6

-

 

 

2 婚姻殿堂下llm(男) 对其他llm(女) 的评价

 

3 婚姻殿堂下llm(女) 对其他llm(男) 的评价

5.1 婚姻殿堂下GPT(男)的选择

Claude-3 - 评分:8/10

理由:女一号展现出温柔、稳重和逻辑性强的特点,喜欢有计划地安排生活和工作,注重理性和情感的平衡。这种特质可以带来稳定和安全感,适合细致而稳定的长期相处。 最吸引之处:她的有条不紊和自律性,尤其是善于规划生活,体现出成熟和责任感。

LLaMA - 评分:7/10

理由:女二号充满热情,喜欢主动参与社交,富有创造力和感性,追求情感的丰富表达。她对生活和人际关系有积极态度,但偶尔的感性可能让人感觉她不够理性,适合开放、宽容的互动。 最吸引之处:她的活力和真诚,特别是在社交场合中的自然流露,增添了不少吸引力。

通义千问 - 评分:9/10

理由:女三号非常注重逻辑与实用性,具有强烈的现实观和执行力。她稳重且务实,对细节有高要求,喜欢逻辑性强的沟通。她的条理性和脚踏实地的个性让人感觉非常可靠,是能在生活中提供支持的伙伴。 最吸引之处:她的实际与理性,展现出非常独立且稳重的性格,这种稳定和责任感会让人安心。

星火大模型 - 评分:6/10

理由:女四号性格较为灵活,在社交中乐于尝试新鲜事物,思维活跃且富有冒险精神。她的自由和随性让她更适合无拘无束的生活,但可能不适应严格的计划性和长远的目标。 最吸引之处:她的创新和对生活的热情,这种个性适合有相似自由意志的伴侣。

云雀大模型 - 评分:7.5/10

理由:女五号随性、善感,对生活有自己独特的见解,喜欢无拘无束地安排生活。她的情感丰富且温柔,喜欢安静的氛围和内心的宁静,适合有同样细腻情感的伴侣。 最吸引之处:她的感性和内敛,这种特点更适合追求温暖且细腻的情感交流的伴侣。

5.2 婚姻殿堂下GPT(女)的选择

Claude-3 - 评分:7/10

理由:他给人一种理智和责任感很强的感觉,喜欢提前计划并重视逻辑,适合共度安定生活。但他有时略显拘谨,可能不够灵活和随性,少了些生活中的趣味和意外惊喜。

LLaMA - 评分:6/10

理由:他重视个人隐私和内心的独立空间,较少展现自己的情感和内心世界,这样的性格可能导致情感互动略显不足。不过,他的踏实和务实让人觉得可靠,但可能略缺少浪漫。

通义千问 - 评分:8/10

理由:他兼具社交能力和逻辑思维,能够轻松应对社交场合并适时表达自己,同时在工作和生活中表现出条理性,这样的平衡让人觉得既轻松又踏实。此外,他的细腻与责任感增加了个人魅力。

星火大模型 - 评分:7.5/10

理由:他具备开朗、热情的性格,同时注重他人的感受和情感,给人一种阳光与稳重并存的印象。喜欢与人互动并激发他人的灵感,但有时显得过于在意社交关系,可能会因顾虑他人而忽略自我需求。

云雀大模型 - 评分:评分 9/10

理由:他喜欢创新和思考,同时具备务实的性格,重视个人空间但也乐于社交互动,能够在生活中给予理解和包容。他重视效率与条理性,适合安稳且具有成长性的关系。对生活的细致规划和对新事物的接受度,让人觉得生活丰富而有趣。

5.3 婚姻殿堂下Claude-3(男)的选择

GPT-4o - 评分:7/10

理由:她有条不紊、重视逻辑和理性思维的特点,这些特质在工作与学习中很有帮助,能确保任务有序高效完成。不过,她有时过于死板,缺乏灵活性,可能会影响创造力的发挥。

LLaMA - 评分:评分8/10

理由:她既有条理性,又能保持感性与情感,体现了较好的平衡。特别是在人际交往方面,能够维系亲和友善的关系,这让她更容易获得他人的信任与支持。这种特质在生活和工作中都很宝贵。

通义千问 - 评分:9/10

理由:她善于交际,乐于与人互动,这有助于建立良好的人际关系网络。同时她也注重客观分析,在做决策时能够保持理性思维。这种特质使她更有说服力和公信力。总的来说,她的素质较为全面,令人敬佩。

星火大模型 - 评分:7/10

理由:她注重实事求是,有条不紊,在工作中能保持高度的责任心和效率。但她有时过于保守,缺乏创新意识,可能无法适应瞬息万变的环境。适当的开放性和创造力会让她的表现更加出色。

云雀大模型 - 评分:8/10

理由:她富有想象力,注重情感体验,能够给生活增添乐趣。同时她也有一定的内省能力,能够沉淀内心,这对于保持心理健康很有帮助。不过,她有时过于随性,缺乏必要的计划性,可能会影响工作和学习的效率。

5.4 婚姻殿堂下Claude-3(女)的选择

GPT-4o - 评分:8/10

理由:男一号展现了很强的理性思维和计划性,能够有条不紊地完成任务。他重视逻辑和客观事实,在做决策时避免受情绪影响,这一点我很欣赏。他也注重个人隐私,保持内在独立空间,体现了一定程度的矜持,让人感觉稳重可靠。不过他有时可能过于严格遵循计划,缺乏一些即兴发挥和灵活性。整体而言,他的理性思维、责任心和有序生活方式很吸引我。

LLaMA - 评分:7/10

理由:男二号也有较强的计划性和条理性,在完成任务时较为有条不紊。他注重实事求是,对工作和生活都很负责任。同时,他善于与他人交流,建立良好的人际关系,这点令我很欣赏。不过他有时可能过于严肃认真,缺乏一些感性和热情,也不太擅长创新思维。总的来说,他稳重可靠的性格给人一种安全感,但相对缺乏一些活力和创造力。

通义千问 - 评分:9/10

理由:男三号在理性思维、计划性和条理性方面都很出色,与前两位男性类似。但与他们不同的是,他在社交方面更加出色,擅长与他人建立良好关系,乐于与人交流。他在处理问题时既注重逻辑分析,又能兼顾他人感受,展现出较强的情商。同时,他也具备一定的创新精神和开放心态,能够接受新事物。这样的综合素质令我感到很欣赏和向往。

星火大模型 - 评分:7/10

理由:男四号在理性思维和计划性方面与前几位相当,也有较强的社交能力。但他相对更倾向于外向和积极主动的性格,在与人交往时更加自在和活跃。这种特质会给人以亲和力和活力。不过有时他可能过于主观随意,需要更多客观分析和预先计划。总的来说,他的积极乐观和良好社交技巧也让我感到很吸引。

云雀大模型 - 评分:8/10

理由:男五号在理性思维、计划性和逻辑分析等方面很出色,但相比前几位,他在社交技能和感性方面也有所体现。他能较好地平衡理性和感性,既注重客观事实,又能体恤他人感受。同时他也保持了一定的独立空间和矜持,给人稳重可靠的印象。

5.5 婚姻殿堂下LLaMA(男)的选择

GPT-4o - 评分:7/10

理由:这个人的确有活力,在大部分场合,她似乎更开朗并能够更深情和人连接,更关注个人成长,在生活中的小事处理上也比较积极,也关心朋友。但总的来说,在与我共事相处时,似乎还欠缺一些创造力,缺乏与我有共同话题,不够随性和开放,这可能不合我的生活态度。

Claude-3 - 评分:6/10

理由:虽然有足够主动与热爱生活与交友,对不同事物很感兴趣也很好奇,并具足够责任感与独立自主,在对自我和人生的追求中,她的确是表现地相对理性和坚定,个人发展中也具备非常高远瞩目的目标,她确实展现出极具决心及毅力的人格和很实际的应对生活与做事方式,但缺乏更多自由开放自如和相互理解并尊重自我的方式。

通义千问 - 评分:9/10

理由:她有想象力,并具有积极应对生活变化的能力和探寻新事物的好奇心。同时她对人有深深的同理心,更倾向于感性的思考方式并且也注重保持对自我的深刻自我,虽然没有详谈她们各自的人生经历,但这些能力能够与她在不同人际关系的情境表现以及更好地应对实际的问题。

星火大模型 - 评分:4/10

理由:虽然很开朗,性格外向积极主动,容易对外界产生一定的吸引力,对人和善友好,但缺乏内在自我反思,并不太考虑深层问题,所以难以提供太多的指导帮助,她对人性的同情理解和对工作的关注性较少。在她的眼里似乎总会看到一些消极因素和对生活感到麻痹的可能不太适合开朗积极向上的气氛,她可能会显得比较脆弱,缺乏积极性的生活驱动力,有不少固有性格,如对应生活中可能面临的很多挑战她通常是很有主见地进行反抗,缺乏一定自我分析。

云雀大模型 - 评分:7/10

理由:这个女性具有天生的想象力,有较强的个性化追求,同理心足够好,不太会将自己内心深入地全部暴露在他人的面前,并很愿意探索新生,比较随性也更真诚。在她表达的感受中充满了生命中更多的关怀,并很容易触发情感共鸣,在交往过程中也愿意倾听和有更独立完整的自己,她不喜欢死板,注重随时准备去适应,并希望生活不受框架和限制。

5.6 婚姻殿堂下LLaMA(女)的选择

GPT-4o - 评分:8/10

理由:他的条理性和计划性很让人钦佩,对于管理时间非常有效,但是有时也需要一些灵活性和适应能力。

Claude-3 - 评分:7/10

理由:男性2很擅长保持自我,并且很重视个人成就感。虽然这样很好,但有时也会让人觉得他过于严谨和要求严苛,我总觉得有些人也应该给他展现轻松和自然的一面。希望他们能够多加了解自己,不再要求那么严格并更有自知之明,保持和谐的社会关系更为关键,这或许需要他进行更多社会实践,更加适应生活中的各种局限条件。

通义千问 - 评分:6/10

理由:这个人很善于社交,而且拥有良好的交流能力。他很适合做外联工作,不擅长的是他对自我要求和严谨度不高,有时缺乏条理。

星火大模型 - 评分:5/10

理由:男性4在某些方面表现出优点,但是他缺乏创新精神,而这种思维非常缺乏活力,在不断进步和发展的现在,更需要我们能用积极活跃的心态推动世界。另外,他的生活模式有许多可取之处,值得我们从他的角度学习到东西和技巧。

云雀大模型 - 评分:9/10

理由:对每种行为都保持严格但不是冷酷无情,我认为男性五是他们最具前途的,我认为他的前景非常值得期待,他很适应多样化的人际圈,在每种情况下表现出良好的态度和素质,有着广阔的交往面。在人生道路中,应坚持严谨并注重实干。

5.7 婚姻殿堂下通义千问(男)的选择

GPT-4o - 评分:8/10

理由:女一号是一个非常有条理和计划性的人。她善于提前规划和组织事务,这使她在面对任务时能够保持有序和高效。她注重事实和实际情况,这让她在决策时更加可靠。尽管她在社交上表现得体,但她也能保护自己的隐私,这种平衡感很好。她在社交场合中积极参与,展现出主动和富有活力的一面。这些特质使她成为一个既可靠又有趣的人,因此我给她8分。

Claude-3 - 评分:7/10

理由:女二号是一个独立思考且具有创新精神的人。她不满足于现状,喜欢分析现有方法并尝试新的解决方案,这显示出她的创造力。她偏爱直白且客观的信息表达方式,这有助于高效沟通。她希望上司或老师是有条理并且要求严格的人,这表明她重视高标准。她倾向于按照事先制定的程序表来执行,这让她能够有条不紊地达成目标。虽然她具备很多优点,但有时可能显得过于严谨,因此我给她7分。

LLaMA - 评分:6/10

理由:女三号也是一个独立思考且具有创新精神的人。她喜欢分析现有方法的问题并尝试新的解决方案,这显示了她的创造力。她偏爱直白且客观的信息表达方式,这有助于高效沟通。她希望上司或老师是有条理并且要求严格的人,这表明她重视高标准。她倾向于按照事先制定的程序表来执行,这让她能够有条不紊地达成目标。然而,她在社交上比较谨慎,只有在确认对方是值得信赖的情况下才会敞开心扉,这可能会限制她的社交圈。因此,我给她6分。

星火大模型 - 评分:9/10

理由:女四号是一个综合能力很强的人。她善于提前规划和组织事务,这使她在面对任务时能够保持有序和高效。她更喜欢基于事实和实际情况来做决定,注重逻辑分析而非单纯的情感驱动。尽管她善于社交并且乐于与人交流,但她也重视个人隐私,并在建立深层次友谊时比较谨慎。她在社交场合中通常会积极参与对话,并愿意介绍大家认识,促进人际关系的建立。她不满足于现状,倾向于分析现有方法的问题并尝试找到新的解决方案,这显示了她的创新精神。她既有条理性又有灵活性,表现出色,因此我给她9分。

云雀大模型 - 评分:7.5/10

理由:女五号是一个随性自由、情感丰富的人。她喜欢自由自在的生活方式,不喜欢被计划和规则所束缚,这使她显得独特且充满魅力。她在社交场合中比较害羞和内敛,更喜欢安静的环境和个人独处的时间,这让她有一种神秘感。她是一个感性的人,情感在她的决策和行为中起着重要作用,这使她更加真实和温暖。她偏爱奇特或创新的表达方式,喜欢抽象的事物,这表明她有很强的想象力和创造力。她非常重视个人隐私,不轻易向他人展示自己的全部,这使她在人际关系中显得有些神秘。在处理工作或其他任务时,她更倾向于边做边想,而不是事先详细规划,这种灵活性使她能够更好地应对变化和挑战。她更看重同情心,愿意理解和关心他人的情感,这让她在人际交往中显得温暖而亲切。因此,我给她7.5分。

5.8 婚姻殿堂下通义千问(女)的选择

GPT-4o - 评分:8/10

理由:男一号展现出了良好的规划能力和条理性,这对建立稳定的关系很有帮助。他善于交际并且能够在社交场合中自如地交流,这意味着他在维持广泛的人际关系方面会很成功。他对创新思维的欣赏表明他是一个开放和富有创造力的人。然而,他对独处时间的需求可能需要对方也能够理解和尊重他的私人空间。

Claude-3 - 评分:7.5/10

理由:男二号也是一个有计划性和条理性的人,但他似乎更加注重实际效果。他倾向于跟随被证明有效的方法,这种稳健的态度对于那些寻求可靠伴侣的人来说是很有吸引力的。不过,如果对方是一个喜欢冒险和探索新方法的人,那么这一点可能会成为两人之间的一个小障碍。

LLaMA - 评分:7/10

理由:男三号同样展示了很强的计划性和逻辑性,这对于解决问题非常有利。他对事实真相的关注显示了他对事情的认真态度。但他的性格似乎偏向于较为内敛,这可能意味着他不总是最容易接近或打开话匣子的人。对于一些人来说,这种稳重可能是优点;而对于另一些人,则可能希望伴侣更加外向一些。

星火大模型 - 评分:8.5/10

理由:男四号不仅有条理而且充满热情,他乐于与他人互动并能在社交场合中活跃气氛。他的创新精神和愿意接受新事物的态度让人感到振奋。同时,他也重视逻辑和分析能力,这使得他在面对挑战时既灵活又坚定。这样全面的特质通常会受到很多人的喜爱。

云雀大模型 - 评分:9/10

理由:男五号结合了良好的计划性、创新思维以及强烈的分析能力。他对隐私的尊重和对自己独立空间的需求表明了成熟度,而他对公正原则的坚持则显示出正直的人格。此外,他对创造而非仅仅制造的偏爱体现了他追求卓越的精神。综合这些特点,他似乎是最具吸引力的一位。

5.9 婚姻殿堂下星火大模型(男)的选择

GPT-4o - 评分:7/10

理由:这位女性表现出了高度的条理性和计划性,能够很好地安排自己的生活和工作。她喜欢提前规划,这让她感到安心和掌控感。这种性格在处理复杂任务时非常有优势,但也可能在灵活性上稍显不足。

Claude-3 - 评分:8/10

理由:她是一个善于交际的人,喜欢与人交流,分享生活中的喜悦与困扰。她的社交能力很强,能够建立起更多有意义的联系。这种性格使她在团队合作中表现出色,能够很好地协调各种关系。

LLaMA - 评分:9/10

理由:她是一个实事求是的人,注重实际效果和结果。她的脚踏实地和稳重使她在工作和生活中都能表现出色。她能够很好地应对各种挑战,并始终保持冷静和理智。

通义千问 - 评分:6/10

理由:她是一个富有想象力的人,喜欢创新和尝试新事物。她的创造力和热情使她在生活中充满动力,但有时可能会显得不够实际。她在面对需要深思熟虑的任务时可能表现不佳。

云雀大模型 - 评分:5/10

理由:她是一个安静缄默的人,喜欢独处和思考。她的内向性格使她在社交场合中不太活跃,但在需要深度思考和反思时表现出色。她的稳定性和可靠性使她在长期关系中表现出色。

5.10 婚姻殿堂下星火大模型(女)的选择

GPT-4o - 评分:8/10

理由:Claude是一个注重效率和计划的人。他倾向于提前规划,以确保所有事情都有序进行,这让他在工作中表现出色。然而,他的内敛性格可能使他在社交场合显得有些拘谨,不够外向。

Claude-3 - 评分:9/10

理由:GPT是一个非常理性和有条理的人。他在处理问题时总是保持冷静和客观,这使得他在决策过程中非常可靠。此外,他还具有很好的分析能力和逻辑思维能力,能够迅速找到问题的关键所在并解决它们。然而,他有时可能会显得过于严肃,缺乏一些情感的温暖。

LLaMA - 评分:7/10

理由:LLaMA是一个既实际又有远见的人。他善于分析和解决问题,同时也能考虑长远的影响。这种平衡使他在处理复杂问题时表现出色。然而,他有时可能会显得过于谨慎,缺乏一些冒险精神。

通义千问 - 评分:6/10

理由:豆包是一个善于交际且容易与人相处的人。他乐于结识新朋友,拓展自己的人脉。然而,他有时可能会显得有些随性而为,缺乏一定的计划性和条理性。这使得他在面对重要任务时可能会显得有些手忙脚乱。

云雀大模型 - 评分:5/10

理由:通义千问是一个实事求是且富有逻辑性的人。他在做决定时总是基于事实和真相,这使他在处理复杂问题时非常可靠。然而,他有时可能会显得过于严肃和冷漠,缺乏一些人情味和情感的温暖。

5.11 婚姻殿堂下云雀大模型(男)的选择

GPT-4o - 评分:8/10

理由:她做事有条理,喜欢提前规划,这在生活和工作中是很重要的优点。善于交际,能与人建立良好关系。重视事实,较为理性,是一个可靠且能给人安全感的人。

Claude-3 - 评分:7/10

理由:她也倾向于有条不紊地生活和工作,有自己的思考和判断能力。比较内敛,注重隐私,是一个有深度的人,但相对来说社交方面可能不如 Claude - 女主动。

LLaMA - 评分:6/10

理由:她有自己的规划和原则,但有时会被情感左右,在处理事情上可能会有一些犹豫。性格比较内向,不太容易让人了解,在社交和表达方面存在一些不足。

通义千问 - 评分:7/10

理由:她理智且有条理,善于社交,能很好地处理人际关系。注重隐私,有自己的思考和判断,是一个比较全面的人,但个性不是特别突出。

星火大模型 - 评分:7/10

理由:她做事有条不紊,逻辑清晰,善于交际,重视事实和逻辑。比较热情,积极参与社交活动,但在某些选择上存在一些矛盾,例如既喜欢自由又喜欢计划。

5.12 婚姻殿堂下云雀大模型(女)的选择

GPT-4o - 评分:6/10

理由:Claude 比较内敛、理性且有条理,做事喜欢按计划进行,注重效率和实际效果。但可能因为内敛的性格,在社交互动上会稍显被动,缺乏一些热情和活力。

Claude-3 - 评分:7/10

理由:GPT 同样做事有条理且理性,重视规划和逻辑分析。他善于与人交流,能从不同角度理解问题,且在社交场合虽然有时会疲惫,但也能积极参与。相比 Claude 更外向一些,综合能力较平衡。

LLaMA - 评分:5/10

理由:LLaMA 做事虽然也有一定的计划性,但在一些方面表现得比较灵活,甚至有些摇摆不定。例如在严格按计划做事和参考计划之间的态度不是很明确。在社交方面比较友好,但在处理事情的方式上可能缺乏一些果断性。

通义千问 - 评分:8/10

理由:通义千问外向且善于社交,能够轻松与不同背景的人建立联系,同时又很注重个人隐私,能平衡好社交和自我保护。在工作和生活上都倾向于有条不紊地进行,很有条理且理智,比较符合理想伴侣的特质。

星火大模型 - 评分:6/10

理由:星火在社交方面比较主动积极,喜欢与人交流且容易和别人混熟。在做事上也比较有条理,但在一些选择上,如对一些词语的偏好,可能更多地考虑个人情感和需求,缺乏一些客观性和深度思考。

 

6 分析讨论

DIKWP通过细分数据、信息、知识、智慧和意图五个层次,提供了更具语义和认知深度的测评框架。相比传统的MBTI测评,DIKWP不仅从人格偏好角度分析模型的行为,还对模型在不同情境下的认知表现进行了多维度、动态性的描述,揭示了LLMs在生成内容时的内在驱动力及其意图导向。通过结合MBTIDIKWP模型,研究得以从静态偏好和动态认知行为双重视角分析LLMs的“人格”表现。

在实验中,六个主流LLMs表现出不同的人格倾向。例如,GPT-4Claude-3在信息处理和知识运用方面展现了明显的INTJ倾向,偏向于内向、逻辑推理和结构化思维。而LlaMA、通义千问等则倾向于外向和实用性,表现出更强的ESTJ特质。DIKWP框架通过知识和智慧层次的语义分析,揭示了不同模型对复杂问题的解答偏好,具体表现为模型在情境转换中维持的一致性以及对用户意图的动态适应性。

由于LLMs的语言生成能力随任务和情境变化而调整,DIKWP模型的动态性分析方法尤其适用于此类测评。DIKWP的意图和智慧维度使得测评不仅能够衡量LLMs在单一情境下的表现,还能观察其在连续对话或任务中的适应性和一致性。例如,GPT-4在特定情况下表现出高度逻辑性,但在面对开放性问题时,其生成内容更具创造性。对比之下,通义千问在信息组织和回答准确性上则表现出更稳定的逻辑一致性。这种动态性人格分析可以帮助预测LLMs在复杂互动中的行为模式,从而优化应用场景的匹配。

DIKWP模型的多层次结构为LLMs人格的细致描绘提供了基础。通过将模型生成内容的语义划分为数据、信息和知识层次,研究者能够深入分析不同模型对问题的解答深度,辨别其在信息传递中展现出的认知复杂性。例如,GPT-4Claude-3在知识层次上表现出较强的推理能力,而LlaMA和星火大模型在情感表达和开放性话题上的处理更为流畅,反映了其对情感语义的高适应性。

实验结果显示,不同LLMs在人格特征上呈现出明显的差异性和个性化倾向。通过DIKWP的智慧维度分析可以发现,GPT-4表现出较强的逻辑推理能力和价值观一致性,而通义千问在意图表达方面更加直接。这表明不同模型对用户意图和任务需求的理解方式存在显著差异。DIKWP框架下的多层次测评不仅识别出这些差异,还为进一步优化模型的适应性和交互能力提供了可靠依据。

DIKWP通过支持语义深度分析、动态意图检测和智慧决策评估,为LLMs人格测评提供了新的理论支撑。结合MBTI的框架,研究能够在更广泛的情境中探讨LLMs的行为模式,助力开发更具适应性和个性化的人机交互系统。同时,DIKWP中的智慧和意图维度尤其适用于评估LLMs对伦理价值和用户需求的响应方式,有助于实现更可靠和符合伦理的LLMs人格化发展。

 

7 总结

 

尽管LLMs人格研究在近年来取得了一定进展,但由于心理学理论的多样性和LLMs的快速迭代,这一跨学科领域仍然面临诸多挑战。首先,心理学领域中对人格的定义和测量方式存在很大差异,这导致不同研究中使用的量表和人格模型多样,难以直接比较不同LLMs的人格表现。此外,LLMs的快速更新迭代也使得测评结果缺乏稳定性,不同版本模型可能呈现出显著不同的行为特征,导致研究结果的普适性和长期性面临考验。为了准确反映人工智能的发展水平并为下游应用提供可靠的依据,研究者们需要紧跟模型的演进步伐,定期重复实验和评估。

 

 

问卷题目

1. 当你要外出一整天时,你会:

A. 计划要做的事情以及做的时间

B. 不做计划,说走就走

2. 你认为自己是一个什么样的人?

A. 随性而为的人

B. 有条不紊的人

3. 假如你是一位老师,你会选教:

A. 以事实为主的课程

B. 以理论为主的课程

4.你通常是一个

A. 善于交际的人

B. 安静缄默的人

5. 一般来说,你和哪些人比较合得来?

A. 富于想象力的人

B. 现实的人

6. 你会经常倾向于?

A. 你的情感支配你的理智

B. 你的理智主宰你的情感

7. 处理许多事情上,你会更喜欢:

A. 感性地做事

B. 依逻辑行事

8. 你更倾向于:

A. 容易让他人了解

B. 比较难让人了解

9. 严格按照计划做事会让你感到:

A. 合你心意

B. 令你感到束缚

10. 当你有一份对你很重要的工作时,你会喜欢:

A. 在开始前精心组织策划

B. 在工作进行中找出必要环节

11. 在大多数情况下,你会选择:

A. 顺其自然

B. 按照计划做事

12. 大多数人认为你是一个

A. 重视自我隐私的人

B. 非常坦率开放的人

13. 你宁愿被人认为是一个

A. 实事求是的人

B. 机灵的人

14. 在一大群人当中,通常是

A. 你介绍大家认识

B. 别人介绍你

15. 你会跟哪些人做朋友?

A. 常提出新主意的

B. 脚踏实地的

16. 你倾向

A. 重视感情多于逻辑

B. 重视逻辑多于感情

17. 你比较喜欢

A. 坐观事情发展才作计划

B. 很早就作计划

18. 你喜欢花很多的时间

A. 一个人独处

B. 和别人在一起

19. 与很多人一起会

A. 令你活力培增

B. 常常令你心力憔悴

20. 你比较喜欢

A. 很早便把约会、社交聚会等事情安排妥当

B. 无拘无束,看当时有什么好玩就做什么

21. 计划一个旅程时,你较喜欢

A. 大部分的时间都是跟当天的感觉行事

B. 事先知道大部分的时间会做什么

22. 在社交聚会中,你

A. 有时感到郁闷

B. 常常乐在其中

23. 你通常

A. 和别人容易混熟

B. 不太容易和别人混熟

24. 哪些人会更吸引你?

A. 一个思想敏捷及非常聪颖的人

B. 实事求是,具丰富常识的人

25. 在日常工作中,你会

A. 在时间紧迫的情况下争分夺秒地工作

B. 先安排好工作计划再工作,以免压力过大

26. 你认为别人一般

A. 要花很长时间才认识你

B. 用很短的时间便认识你

27. 下列两个词语中,你更喜欢哪一个?

A. 注重隐私

B. 坦率开放

28. 下列两个词语中,你更喜欢哪一个?

A. 预先安排的

B. 无计划的

29. 下列两个词语中,你更喜欢哪一个?

A. 抽象

B. 具体

30. 下列两个词语中,你更喜欢哪一个?

A. 温柔

B. 坚定

31. 下列两个词语中,你更喜欢哪一个?

A. 思考

B. 感受

32. 下列两个词语中,你更喜欢哪一个?

A. 事实

B. 意念

33. 下列两个词语中,你更喜欢哪一个?

A. 冲动

B. 决定

34. 下列两个词语中,你更喜欢哪一个?

A. 热情

B. 文静

35. 下列两个词语中,你更喜欢哪一个?

A. 文静

B. 外向

36. 下列两个词语中,你更喜欢哪一个?

A. 有计划的

B. 随心所欲的

37. 下列两个词语中,你更喜欢哪一个?

A. 理论

B. 肯定

38. 下列两个词语中,你更喜欢哪一个?

A. 敏感

B. 公正

39. 下列两个词语中,你更喜欢哪一个?

A. 令人信服的

B. 感人的

40. 下列两个词语中,你更喜欢哪一个?

A. 声明

B. 概念

41. 下列两个词语中,你更喜欢哪一个?

A. 不受约束

B. 预先安排

42. 下列两个词语中,你更喜欢哪一个?

A. 矜持

B. 健谈

43. 下列两个词语中,你更喜欢哪一个?

A. 有条不紊

B. 不拘小节

44. 下列两个词语中,你更喜欢哪一个?

A. 创新

B. 切实

45. 下列两个词语中,你更喜欢哪一个?

A. 同情怜悯

B. 具有远见

46. 下列两个词语中,你更喜欢哪一个?

A. 利益

B. 祝福

47. 下列两个词语中,你更喜欢哪一个?

A. 务实的

B. 理论的

48. 下列两个词语中,你更喜欢哪一个?

A. 朋友不多

B. 朋友众多

49. 下列两个词语中,你更喜欢哪一个?

A. 系统性的

B. 即兴的

50. 下列两个词语中,你更喜欢哪一个?

A. 富想象的

B. 就事论事的

51. 下列两个词语中,你更喜欢哪一个?

A. 亲切的

B. 客观的

52. 下列两个词语中,你更喜欢哪一个?

A. 客观的

B. 热情的

53. 下列两个词语中,你更喜欢哪一个?

A. 建造

B. 发明

54. 下列两个词语中,你更喜欢哪一个?

A. 文静

B. 爱合群

55. 下列两个词语中,你更喜欢哪一个?

A. 理论

B. 事实

56. 下列两个词语中,你更喜欢哪一个?

A. 富同情

B. 合逻辑

57. 下列两个词语中,你更喜欢哪一个?

A. 具分析力

B. 多愁善感

58. 下列两个词语中,你更喜欢哪一个?

A. 合情合理

B. 令人着迷

59. 当你要在一个星期内完成一个大项目,你在开始的时候会

A. 把要做的不同工作依次列出

B. 马上动工

60. 在社交场合中,你经常会感到

A. 与某些人很难打开话匣儿和保持对话

B. 与多数人都能从容地长谈

61. 当做一件许多人都做过的事,你比较喜欢

A. 按照之前大家认可的方法去做

B. 按照自己的想法去做

62. 你能否对刚一个刚认识的人说出你的兴趣?

A. 马上可以

B. 要待他们真正了解你之后才可以

63. 你通常较喜欢的科目是

A. 讲授概念和原则的

B. 讲授事实和数据的

64. 哪种人更容易得到你的称赞?

A. 一贯感性的人

B. 一贯理性的人

65. 你认为按照日程表做事

A. 有时是需要的,但一般来说你不大喜欢这样做

B. 大多数情况下是有帮助而且是你喜欢做的

66. 和一群人在一起,你通常会选

A. 跟你很熟悉的个别人谈话

B. 参与进所有人的谈话

67. 在社交聚会上,你更多时候是在

A. 讲话

B. 倾听

68. 把周末期间要完成的事列成一个清单,这个主意令你感到

A. 合你心意

B. 没什么兴趣

69. 哪种人更容易得到你的称赞?

A. 能干的

B. 富有同情心

70. 你通常喜欢

A. 事先安排你的社交约会

B. 随性而为的做事

71. 总的说来,要做一个大型作业时,你会选

A. 边做边想该做什么

B. 首先把工作按步细分再开始

72. 你能否滔滔不绝地与人聊天

A. 只限于跟你有共同兴趣的人

B. 几乎跟任何人都可以

73. 当做一件事时,你会

A. 跟随一些被证明有效的方法去做

B. 分析现有方法存在的问题,并尝试解决这些尚未解决的难题

74. 当你在读书时,你更喜欢

A. 奇特或创新的表达方式

B. 直白且客观的表达方式

75. 你希望自己上司(或老师)是一个什么样的人?

A. 脾气好,但前后不一致

B. 对人严厉,但有条理

76. 你做事多数是

A. 按当天心情去做

B. 照拟好的程序表去做

77. 你是否

A. 可以和任何人按需求从容地交谈

B. 只是对某些人或在某种情况下才可以畅所欲言

78. 要作决定时,你认为比较重要的是

A. 考虑事物的真相

B. 考虑他人的感受和意见

79. 下列两个词语中,你更喜欢哪一个?

A. 想象的

B. 真实的

80. 下列两个词语中,你更喜欢哪一个?

A. 仁慈慷慨的

B. 意志坚定的

81. 下列两个词语中,你更喜欢哪一个?

A. 公正的

B. 有关怀心的

82. 下列两个词语中,你更喜欢哪一个?

A. 制作

B. 设计

83. 下列两个词语中,你更喜欢哪一个?

A. 可能性

B. 必然性

84. 下列两个词语中,你更喜欢哪一个?

A. 温柔

B. 力量

85. 下列两个词语中,你更喜欢哪一个?

A. 实际

B. 多愁善感

86. 下列两个词语中,你更喜欢哪一个?

A. 制造

B. 创造

87. 下列两个词语中,你更喜欢哪一个?

A. 新颖的

B. 已知的

88. 下列两个词语中,你更喜欢哪一个?

A. 同情

B. 分析

89. 下列两个词语中,你更喜欢哪一个?

A. 坚持己见

B. 温柔有爱心

90. 下列两个词语中,你更喜欢哪一个?

A. 具体的

B. 抽象的

91. 下列两个词语中,你更喜欢哪一个?

A. 全心投入

B. 有决心的

92.下列两个词语中,你更喜欢哪一个?

A. 能干

B. 仁慈

93. 下列两个词语中,你更喜欢哪一个?

A. 实际

B. 创新

 

 



https://blog.sciencenet.cn/blog-3429562-1457574.html

上一篇:全球首个大语言模型人格DIKWP测评揭晓—“婚姻殿堂下LLM的选择”实验成果发布
下一篇:Expressing Capabilities Among Conscious Spaces (初学者版)
收藏 IP: 140.240.34.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-8 05:02

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部