日本最新研究顯示,AI 分析 11 歲兒童短篇作文,能精準預測 22 年後學歷及認知力。團隊用 1958 年出生的約萬名英國兒童 11 歲作文,主題為「想像 25 歲的自己」,發現 AI 預估準確度與教師評量差不多,並明顯優於基因預測。
研究分析平均約 250 字的短篇作文,用 OpenAI GPT 模型等大型語言模型提取 1,536 維特徵量,並測量 534 項語言指標、可讀性及文法拼字錯誤等。結果顯示,AI 預測 11 歲孩童理解力準確度達 59%,教師評估為 57%,基因預測只 14%。
同時發現,以作文分析能預測語言能力、數學能力等認知技能,準確度均達 55% 以上。對非認知特質如職業抱負、學習動機等準度較低,但仍優於基因預測。結合作文、教師評估及基因三方法,精準度可提升至近標準智力測驗的重測可信度。更令人驚訝的是,11 歲作文還能精準預測 33 歲學歷等。純粹基於作文的準確度達 26%,教師評估為 29%,基因為 19%。三方法結合後,教育成就準確度可達 38%。
傳統社會學預測因子如父母教育程度僅達 12%,出生體重及身高等生物學指標準確度更只有 1%~3%。團隊重建類似「脆弱家庭挑戰」研究的社會學模型,含性別、父母教育水準、社會階層等變數,準確度為 18%,仍遠低於 AI 文本分析。
細究各文本分析模型,發現深度學習是關鍵。傳統可讀性指標、拼字文法錯誤率、計算語言學測量等雖有一定效果,但深度學習幾乎含所有重要資訊,成為預測準確度的驅動因素。研究採 SuperLearner 框架,結合極端梯度提升、隨機森林、支援向量等多種機器學習演算法,交叉驗證避免過度擬合。結果顯示線性模型及隨機森林大部分預測獲最高權重。
新研究挑戰了「人生本質不可預測」觀點。標準社會調查數據僅能解釋約 20% 個體差異,此研究卻以非標準數據大幅提升精確度。近年自然語言革命性發展,成為行為科學家預測心理社會特徵的強大工具。
國際大學校長橘川武郎等專家認為,雖然顯示文本預測潛力,但仍需考慮倫理問題。準確度持續提升並整合至社會各層面後,如何規範應用系統將成為重要課題。研究也強調需要更多不同類型非標準數據的縱向資料庫,以驗證結果普遍性。
不過研究仍有限制,包括樣本僅為 1958 年出生的英國兒童,是否適用當代學生有待驗證。研究也未充分探索三種資訊來源,之後可用更先進 GPT 模型及貝氏定理提升準確度。
(本文由 Unwire HK 授權轉載;首圖來源:shutterstock)
文章看完覺得有幫助,何不給我們一個鼓勵
請我們喝杯咖啡您的咖啡贊助將是讓我們持續走下去的動力
總金額共新臺幣 0 元 《關於請喝咖啡的 Q & A》 取消 確認(责任编辑:艾伦帕森斯)
中餐的品类丰富堪称世界之最,大量好吃、有大众认知基础的土品类,价值空间很大。...[详细]
公司相关负责人表示,“我们那个时候其实刚刚完成A轮融资没多久,实际上拿钱并不合算,不过我们认为他们可能会给的资源,最后觉得合算才接受的,实际上那时候我们并不知道他们真正能给我们带来什么资源...[详细]
一个有着腾讯大厂多年管理经验和创业经验的人,在市场上往往不缺工作机会,只不过要看他是否愿意放下身段去做,从创业公司CEO到某大公司技术经理或高级开发,这种落差不是每个人都能接受。...[详细]
UGC更多是兴趣娱乐参与型,PGC有明确的利益导向,看似非标,其实是标准化的生产,知乎上面很多人都是PGC,为了一个明确的商业目的生产内容,而且这个过程是有点标准化,分答刚做了一个分答小讲,也是一个P...[详细]
于是,碧桂园一下子成了学区房。...[详细]
因此我们可以得出这么一个结论: 所以结论是如果有哪个公司忽悠你不拿或只拿很低报酬,你一定要用直觉去判断,你碰到下一个马云的机率比中彩票还要低。...[详细]
(4)英雄的皮肤、台词和画风的设计思路 对于一个目标用户里包含广大女性玩家的游戏,游戏的画面是否精致同样非常重要,就像选男女朋友的时候第一眼看的是脸,选英雄的时候...[详细]
给人的感觉他虽然不能回到2014年,但是可以回到了小米创业之初,甚至回到那个在金山时的雷军。...[详细]
所以,在公共场所使用充电的时候,不要点任何的同意按纽,尽量携带自己的充电设备,并且安装一些防护软件。...[详细]
” 没有库存的商业模式,稳健的运营、资本的追捧,一切看起来都很完美…… 被外部环境和资本裹挟前进 2011年1月,乐淘发布了第三轮融资信息,联创策源、老虎...[详细]